7
단순성
소위 ‘단순성이라는 문제’의 중요성에 관하여 합의가 이루지지 않은 듯하다. 바일(Weyl)은, 얼마 전에, ‘단순성이라는 문제는 자연과학들에 대한 인식론과 관련하여 핵심적인 중요성을 띤다’고 말했다. 그럼에도 불구하고 그 문제에 관한 흥미는 최근에 쇠퇴했다; 아마도 특히 바일(Weyl)의 통찰적인 분석 이후에 그 문제를 해결할 가능성이 거의 없다고 보였기 때문에.
아주 최근까지 단순성이라는 개념은, 단순성이 무엇인지와 단순성이 왜 틀림없이 귀중한지가 전적으로 분명한 것인 양, 무비판적으로 사용되었다. 적지 않은 과학철학자들이, 단순성이라는 개념이 야기하는 난제들을 심지어 주목하지 않고, 자신들의 이론들에서 단순성이라는 개념에게 결정적으로 중요한 위치를 부여했다. 예를 들어, 마흐(Mach), 키르히호프(Kirchhoff), 그리고 아베나리우스(Avenarius)를 추종하는 사람들은 인과적 설명이라는 개념을 ‘가장 단순한 기술’이라는 개념으로 대체하려고 노력했다. ‘가장 단순한’이라는 형용사나 유사한 단어가 없다면 이 교설은 말하는 바가 없을 터이다. 이론들의 도움을 받는 세상에 대한 한 가지 기술을, 단칭명제들의 도움을 받는 다른 한 가지 기술보다 우리가 선호하는 이유를 이 교설이 설명하기로 기대되듯이 이론들은 단칭명제들보다 더 단순하다고 그 교설은 전제하는 듯이 보인다. 그럼에도 불구하고 이론들이 더 단순해야하는 이유나 단순성에 의하여 더 정확하게 의미되는 것을 설명하려고 노력한 사람은 거의 없다.
게다가 이론들이란 단순성을 목적으로 사용되어야 한다고 우리가 전제한다면, 분명히 우리는 가장 단순한 이론들을 사용해야 한다. 이것이, 푸앵카레(Poincaré)가 이론들 선택에 대한 자신의 원칙으로 정식화하게 되는 방법인데 그로부터 이론의 선택이 규약의 문제가 된다. 그러나 어느 이론들이 가장 단순한 이론들인가?
41 단순성에 대한 감성학적 및 실용적 개념의 배제
‘단순성’이라는 단어는 매우 많이 다양한 의미로 쓰인다. 예를 들어 슈뢰딩거(Schrödinger)의 이론은 방법론적 의미에서 커다란 단순성을 띠지만 또 다른 의미에서는 그 이론이 ‘복잡하다’고 지칭될 개연성이 높다. 우리는 문제에 관하여, 그 문제의 해결책이 단순하지 않고 어렵다거나 발표나 설명에 관하여 그 발표나 설명이 단순한 게 아니라 복잡하다고 말할 수 있다.
우선, 나는 우리의 토론으로부터 발표나 설명과 같은 것에 대한 ‘단순성’이라는 용어의 적용을 배제하겠다. 동일한 수학적 증거에 대한 두 가지 설명들에 관하여 한 가지는 다른 한 가지보다 더 단순하거나 더 우아하다고 때때로 언급된다. 이것은, 지식론의 관점에서 흥미롭지 않은 구분이다; 그 구분은 논리학의 영역에 속하지는 않고 다만 감성학적이거나 실용적 특징에 대한 선호를 가리킨다. 한 가지 업무가 또 다른 업무보다 ‘더 단순한 방법에 의하여 수행될’ 것이라고 말하여 그 한 가지 업무가 보다 쉽게 수행될 수 있다는 것이나 그 업무를 수행하기 위하여 훈련이나 지식이 덜 필요하다는 것을 의미한다고 사람들이 말할 때 상황은 유사하다. 모든 그런 경우들에서 ‘단순한’이라는 단어는 쉽게 제거될 수 있다; 그 단어의 사용은 논리 외적(外的)이다.
42 단순성에 대한 방법론적 문제
우리가 단순성에 대한 감성학적이거나 실용적인 개념들을 제거한 다음에 혹시 무엇이 남는가? 논리학자에게 중요성을 띤 단순성이라는 개념이 있는가? 그 이론들이 지닌 단순성의 등급들에 따라서 논리적으로 대등하지 않은 이론들을 구분하는 일이 가능한가?
이 질문에 대한 답변은, 이 개념을 정의(定義)하려는 대부분의 시도들이 얼마나 성공적이지 못했다는 것을 알기에, 의심스럽게 보일 확률이 높다 (이 문장의 원문은 The answer to this question may well seem doubtful, seeing how little successful have been most attempts to define this concept인데 seeing이하의 분사구문의 주어가 The answer to this question이 될 수 없고 일반인이기 때문에 분사구문을 써서는 안 되고 일반인 주어를 넣어 절로 표현해야 한다: 역자). 슐릭(Schlick) 자신으로서는 부정적인 답변을 낸다. 그는 다음과 같이 말한다: ‘단순성은... 특징에서 부분적으로 실제적이고, 부분적으로 감성학적인 선호들을 가리키는 개념이다.’ 그리고 여기서 우리를 흥미롭게 하여 내가 단순성에 대한 인식론적 개념으로 지칭할 개념에 대하여 서술할 때 그가 이 답변을 내놓은 것을 주목할 만하다; 이유인즉 그는 계속해서 다음과 같이 서술하기 때문이다: ‘여기서 “단순성”에 의하여 실제로 의미되는 바를 우리가 설명할 수 없을지라도, 우리는 그럼에도 불구하고 일련의 관찰사항들을 매우 단순한 공식들로써 (예를 들어 1차, 2차 함수, 혹은 지수 함수에 의하여) 재현하는 데 성공한 여하한 과학자도 즉각적으로 자신이 법칙을 발견했다고 확신한다는 사실을 인정해야 한다.’
슐릭(Schlick)은 단순성이라는 개념의 도움을 받아서 법칙-같은 규칙성이라는 개념을 정의(定義)하는 가능성, 그리고 특히 ‘법칙’과 ‘우연’의 구분을 토론한다. 그는 마지막으로 ‘단순성은 분명히 전적으로 상대적이어서 모호한 개념이다; 인과성에 대한 엄격한 정의(定義)는 단순성의 도움을 받아서 획득될 수 없다; 법칙과 우연도 또한 정확하게 구분될 수 없다’라는 언급으로써 그 가능성과 그 구분을 묵살한다. 이 글귀로부터 단순성이라는 개념이 실제로 무엇을 성취하기로 기대되는지가 분명해진다: 그 개념은 사건들의 법칙-같음이나 규칙성의 정도에 대한 척도를 제공할 수 있다. 유사한 견해가 파이글(Feigl)에 의하여 표현되는데 그는 ‘단순성이라는 개념의 도움을 받아서 규칙성의 혹은 법칙-같음의 정도를 정의(定義)하는 개념’에 관하여 말한다.
단순성에 대한 인식론적 개념은 귀납적 논리의 이론들에서 특별한 역할을 하는데, 예를 들어, ‘가장 단순한 곡선’이라는 문제와 관련해서이다. 귀납적 논리를 신봉하는 사람들은, 우리가 특수한 관찰사항들로부터의 일반화에 의하여 자연법칙들에 도달한다고 추정한다. 일련의 관찰사항들에서의 다양한 결과들을 좌표체계에서 계획된 점들(points)로서 우리가 간주한다면 법칙을 도표로 재현하는 것은 이 점들(points) 모두를 지나는 곡선이 될 것이다. 그러나 유한한 숫자의 점들(points)을 통하여 우리는 항상 가장 다양한 형태의 무한한 숫자의 곡선들을 그릴 수 있다. 그러므로 법칙은 관찰사항들에 의하여 독특하게 결정되지 않기 때문에 귀납적 논리는, 이 가능한 모든 곡선들 가운데서 어느 곡선이 선택되어야 하는지를 결정하는 문제에 직면한다.
통상적인 답변은, ‘가장 단순한 곡선을 선택하라’이다. 예를 들어 비트겐슈타인은 다음과 같이 말한다: ‘귀납 과정은 우리의 경험과 조화를 이루도록 만들어질 수 있는 가장 단순한 법칙을 추정하는 데 놓여있다.’ 가장 단순한 법칙을 선택하는 데서, 가령 1차 함수는 2차 함수보다, 원은 타원형보다 더 단순하다, 기타 등등이라는 것이 통상적으로 암묵적으로 전체된다. 그러나 이 특정 단순성들의 계층구조를 다른 계층구조에 우선하여 선택하는 것에 대해서나 ‘단순한’ 법칙들은 덜 단순한 – 감성학적이고 실제적인 이점들은 별도로 – 법칙들보다 이점들을 지니고 있다고 믿는 것에 대해서도 근거가 주어지지 않는다. 슐릭(Schlick)과 파이글(Feigl)은 나트킨(Natkin)의 미발간 논문을 언급하는데 나트킨(Natkin)은 슐릭(Schlick)의 설명에 따라서, 하나의 곡선의 평균 곡률이 더 작다면 하나의 곡선이 또 다른 곡선보다 더 단순하다고 지칭할 것을 제안한다; 혹은, 파이글(Feigl)의 설명에 따라서 하나의 곡선이 직선으로부터 덜 이탈한다면 (이 문장의 원문은 Schlick and Feigl mention6 an unpublished paper of Natkin who, according to Schlick's account, proposes to call one curve simpler than another if its average curvature is smaller; or, according to Feigl's account, if it deviates less from a straight line.인데 관계대명사의 선행사가 고유명사일 경우에는 관계대명사와 선행사 사이에 쉼표를 두어 계속적 용법으로 사용해야 하는데 이 경우는 문법을 무시했다: 역자). (두 가지 설명들은 대등하지 않다.) 이 정의(定義)는 우리의 직관들과 상당히 잘 일치하는 듯이 보인다; 그러나 그 정의(定義)는 어떤 정도로든 결정적인 요점을 놓친다; 그 정의(定義)는 예를 들어 포물선의 특정 부분들을 (점근선 부분들) 원, 기타 등등보다 훨씬 더 단순하게 만들 터이다. 그래서 실제로 나는, 문제가 그런 ‘책략들’에 (슐릭[Schlick]이 지칭하는 바와 같이) 의하여 해결될 수 있다고 생각하지 않는다. 게다가 단순성이 이 특정 방식으로 정의(定義)된다면 왜 우리가 단순성에 우선권을 두어야 하는지는 수수께끼로 남을 터이다.
바일(Weyl)은, 단순성을 확률에 근거시키려는 매우 흥미로운 시도를 토론하여 배척한다. ‘예를 들어 동일한 함수 y = f(x)의 값들의 (x, y) 20가지 좌표 쌍들이 모눈종이 위에 계획될 때, 직선 위에 놓인다고 (기대되는 정확성 안에서) 추정하라. 그 다음에 우리는, 우리가 여기서 엄격한 자연법칙과 직면하고 있다고 그리고 y가 선(線)으로 x에 의존한다고 추측할 것이다. 그리고 우리는, 직선의 단순성 때문에, 혹은 문제의 법칙이 다른 법칙이었다면 자의적으로 선택된 관찰사항들의 바로 이 20쌍들이 틀림없이 매우 가깝게 직선 위에 놓인다는 것은 그렇게 극단적으로 비개연적일 터이기 때문에 우리는 이것을 추측할 것이다. 이제 우리가 직선을 내삽법(內揷法: interpolation)과 외삽법(外揷法: extrapolation)으로서 사용한다면, 우리는 관찰사항들이 우리에게 알려주는 것을 초월하는 예측들을 얻는다. 그러나 이 분석도 비판이 가능하다. ... 20번의 관찰들에 의하여 충족될 모든 종류의 수학적 함수들을 정의(定義)하는 일이 항상 가능할 것이다; 그리고 이 함수들 중 몇 가지 함수들은 직선으로부터 상당히 이탈할 것이다. 그리고 이것들 중 모든 하나의 것에 대하여 20가지 관찰사항들이 이 곡선이 참인 법칙을 표상하지 않는다면 바로 이 곡선 위에 틀림없이 놓일 것임은 극단적으로 비개연적일 터이라고 우리는 주장할 것이다. 그리하여 결국 함수 혹은 오히려 함수들의 집합은 자체의 수학적 단순성 때문에 수학에 의하여, 선험적으로, 우리에게 제시되어야 한다는 것은 필수적이다. 이 함수들의 집합은 충족되는 관찰사항들의 숫자만큼 많은 한도들에 의존해서는 안 된다 것이 주목되어야 한다.’ ‘함수들의 집합은 그 집합의 수학적 단순성 때문에 수학에 의하여 선험적으로 틀림없이 우리에게 제시된다’는 바일(Weyl)의 논평들과 한도들의 숫자에 대한 그의 언급은 나의 견해와 (43장에서 전개될) 일치한다. 그러나 바일(Weyl)은 ‘수학적 단순성’이 무엇인지 말하지 않는다; 그리고 무엇보다도, 그는 더 단순한 법칙이 더 복잡한 법칙과 비교되어 어떤 논리적이거나 인식론적인 이점들을 지니기로 예상되는지를 말하지 않는다.
지금까지 인용된 다양한 글귀들은, 그 글귀들이 우리의 현재 목표에 – 단순성에 대한 인식론적 개념의 분석 - 관하여 지닌 관련성 때문에 매우 중요하다. 왜냐하면 이 개념이 아직도 정확하게 결정되지 않았기 때문이다. 그리하여 인식론자들이 흥미를 갖는 단순성이라는 개념은 실제로 전혀 다른 것이라고 말함에 의하여 이 개념을 정확하게 만들려는 여하한 시도를 (나의 시도와 같은) 배척하는 것이 가능하다. 그런 반대론들에 대하여 나는 내가 ‘단순성’이라는 단어에 조금도 중요성을 부여하지 않는다고 나는 답변할 수 있을 터이다. 그 용어는 나에 의하여 도입되지 않았고 나는 그 용어의 약점들을 의식하고
있다. 내가 주장하는 유일한 것은, 내가 설명할 예정인 단순성이라는 개념은 내가 인용한 구절들이 증명하는 바와 같이 과학철학자들이 지닌 ‘단순성이라는 문제’와 관련하여 과학철학자들에 의하여 그렇게 자주 제기되는 바로 저 질문들에 답변하는 데 도움이 된다는 것이다.
43 단순성과 오류판정 가능성의 등급
단순성이라는 개념과 관련하여, 우리가 이 개념을 오류판정 가능성의 등급과 동일시한다면 발생하는 인식론적 문제들은 모두 답변될 수 있다. 이 견해는 반론에 부딪힐 것 같다;* 그래서 나는 먼저 그 견해를 직관적으로 보다 수용될
수 있게 만들려고 노력할 것이다.
나는 이미, 더 낮은 차원의 이론들이 더 높은 차원의 이론들보다 더 쉽게 오류로 판정될 수 있다는 것을 밝혔다. 예를 들어 1차 함수의 형태를 지닌 법칙은 2차 함수를 통하여 표현될 수 있는 법칙보다 더 쉽게 오류로 판정된 수 있다. 그러나 후자(後者)는 여전히, 그 수학적 형태가 대수적 함수의 형태인 법칙들 가운데서 가장 잘 오류로 판정될 수 있는 법칙들에 속한다. 이것은 단순성에 관한 슐릭(Schlick)의 언급과 잘 일치한다: “우리에게는 확실히 1차 함수를 2차 함수보다 더 단순한 것으로가 간주하려는 경향이 있는데 비록 후자(後者)가 또한 의심의 여지없이 완벽하게 훌륭한 법칙을 표상한다할지라도 그렇다...”
우리가 본 바와 같이, 이론이 지닌 보편성과 정확성의 등급은 그 이론이 지닌 오류판정 가능성의 등급과 비례한다. 그리하여 우리는 혹시 이론이 지닌 엄격도를 – 말하자면 이론이 자연에게 법칙의 엄격함을 부과하는 정도 – 이론이 지닌 오류판정 가능성의 등급과 동일시할 것이다; 이것은, 후자(後者)가 바로 슐릭(Schlick)과 파이글(Feigl)이 단순성이라는 개념이 수행할 것이라고 기대했던 것을 수행한다는 것을 보여준다. 나는, 슐릭(Schlick)이 법칙과 우연을 구분하고자 희망했던 것은 또한 오류판정 가능성의 등급들이라는 개념의 도움을 받아서 설명될 수 있다고 나는 첨언할 것이다: 우연-같은 특징들을 지닌 수열들에 관한 확률 서술들은 무한한 차원을 지니는 것으로 판명된다 (65절 참조); 단순한 것이 아니라 복잡한 (58절 및 59절의 후반부 참조); 그리고 특별한 보호장치들 하에서만 오류로 판정될 수 있는 (68절).
시험가능성 등급들의 비교는 31절에서 40절까지 상세하게 토론되었다. 그것에서 제시된 보기들 중 몇 가지와 다른 세부사항들은 단순성이라는 문제로 쉽게 이전될 수 있다. 이것은 특히, 이론이 지닌 보편성의 등급에 관하여 유효하다: 보다 보편적인 서술은 많은 덜 보편적인 서술들을 대신할 수 있고, 그리하여 저 이유 때문에 ‘더 단순하다’고 흔히 지칭되었다. 이론의 차원이라는 개념은 단순성이라는 개념을 결정하는 한도들의 숫자를 이용하는 바일(Weyl)의 개념에 정확성을 부여한다고 언급될 것이다.* 이론이 지닌 차원의 형식적 축소와 실질적 축소에 대한 우리의 구분으로써 (40절 참조), 바일(Weyl)의 이론에 대하여 가능한 특정 반대론들이 극복될 수 있다. 이 반대론들 중 한 가지 반대론은, 그 축들이 주어진 비율이고 그 숫자적 이심률(異心率: eccentricity)이 주어지는 타원형들의 집합은 분명히 덜 ‘단순할’지라도 정확하게 원들의 집합만큼 많은 한도들을 지닌다는 것이다.
무엇보다도, 우리의 이론은 단순성이 그렇게 고도로 바람직한 이유를 설명한다. 이것을 이해하기 위해서는 우리가 ‘사고의 경제 원리’나 그런 종류의 어떤 것도 전제할 필요가 없다. 지식이 우리의 목표라면 단순한 서술들은 덜 단순한 서술들보다 귀중히 여겨져야 하는데 왜냐하면 단순한 서술들이 우리에 더 많은 것을 알려주기 때문이다; 단순한 서술들이 지닌 경험적 내용이 더 크기 때문이다; 그리고 단순한 서술들 더 잘 시험될 수 있기 때문이다.
44 기하학적 형태와 함수적 형태
단순성이라는 개념에 대한 우리의 견해로 인하여 우리는, 지금까지 이 개념이 쓸모가 있는지를 의심스럽게 만들었던 몇 가지 모순들을 해결할 수 있다.
가령 로그 곡선의 기하학적 형태를 특히 단순한 것으로 간주할 사람을 거의 없을 터이다; 그러나 로그 함수에 의하여 표상될 수 있는 법칙은 통상적으로 단순한 법칙으로서 간주된다. 유사하게 사인 함수(sine function)는, 사인 곡선의 기하학적 형태가 혹시 그렇게 매우 단순하지 않을지라도, 흔히 단순하다고 언급된다.
이와 같은 난제들은, 우리가 한계들의 숫자와 오류판정 가능성의 정도 사이의 연결을 기억한다면, 그리고 우리가 차원들의 형식적 및 실제적 감소를 구분한다면, 제거될 수 있다. (우리는 또한 좌표체계들의 변형들과 관련한 불변성의 역할을 기억해야 한다.) 우리가 곡선의 기하학적 형태나 모양에 대하여 말한다면 우리가 요구하는 것은 변위(變位: displacements)들의 무리에 속하는 모든 변형들과 관련한 불변이고, 그리하여 우리는 유사성 변형들과 관련한 불변을 요구할 것이다; 왜냐하면 우리는 기하학적 형상이나 형태를 확고한 위치에 묶여지고 있는 것으로서 생각하지 않기 때문이다. 결과적으로 우리가 한 가지-한도적인 로그 곡선의 형태를 (y =
45 유클리드 기하학의 단순성
상대성 이론에 대한 토론들 대부분에서 중요한 역할을 한 쟁점들 중 한 가지 쟁점은 유클리드 기하학의 단순성이었다. 정확한 의미에서의 유클리드 기하학이, 주어진 곡률 상수(constant curvature)를 지닌 비-유클리드 기하학보다 – 장소에 따라 변하는 곡률들을 지닌 비-유클리드 기하학들은 말할 것도 없고 - 더 단순하다는 것을 아무도 의심한 적이 없었다.
첫눈에 보기에 여기에서 관련된 단순성의 종류는 오류판정 가능성의 등급들과 관련이 없는 듯이 보인다. 그러나 문제의 서술들이 경험적 가설들로서 정식화된다면, 단순성과 오류판정 가능성이라는 두 가지 개념들이 이 경우에도 또한 일치하는 것을 우리는 발견한다.
‘우리의 세상에서는 우리가 그렇고 그런 곡률반경을 지닌 특정 계량기하학을 우리가 이용해야 한다’는 가설을 우리가 시험하는 것을 어떤 시험들이 도울지 고려하자. 시험은, 우리가 특정 기하학적 존재들을 특정 물리적 대상들과 – 예를 들어 직선들을 광선들과 – 동일시한다는 조건으로만 가능할 것이다;
또는 점들(points)을 실들(threads)의 교차와 동일시한다는. 그런 동일시가 (상호 관련시키는 정의[定義], 또는 혹시 실물 지시적 정의[實物 指示的 定義: ostensive definition]; 17절 참조)가 채택된다면, 유클리드 광선-기하학의 유효성에 대한 가설은 비-유클리드 기하학의 유효성을 주장하는 상대방 가설들 중 어떤 가설보다 더 높은 등급까지 오류로 판정될 수 있음이 밝혀질 수 있다.
이유인즉 우리가 광선 삼각형의 내각들의 합을 측정한다면, 180도로부터의 여하한 중요한 편차도 유클리드 가설을 오류로 판정할 것이기 때문이다. 다른 한편으로 주어진 곡률을 지닌 보야이-로바체프스키(Bolyai-Lobatschewski)의 가설은 180도를 넘지 않는 특정 측정과도 양립할 수 있을 터이다. 게다가 이 가설을 오류로 판정하기 위하여, 내각들의 합뿐만 아니라 삼각형의 (절대) 크기 또한 측정함이 필요할 터이다; 그리고 이것은, 내각들에 덧붙여 면적의 단위와 같은 측정과 관련된 추가적 단위가 정의(定義)되어야 할 터임을 의미한다. 그리하여 우리는, 오류판정과 관련하여 더 많은 측정들이 필요함을 안다; 가설은 측정들의 결과들에서 더 큰 변동들과 양립 가능하다는 것; 그리고 그리하여 가설은 오류로 판정하기가 더 어렵다는 것: 가설은 더 낮은 등급까지 오류로 판정될 수 있다. 또 다른 방식으로 표현하면, 유클리드 기하학은 그 안에서 유사성 변환들이 가능한 확정된 곡률을 지닌 유일한 계량기하학이다. 결론적으로, 유클리드 기하학의 도형들은 더 많은 변형들과 관련하여 불변적일 수 있다; 다시 말해서, 그 도형들은 더 낮은 차원을 지닐 수 있다: 그 도형들은 더 단순할 수 있다.
46 규약주의와 단순성이라는 개념
규약주의자가 ‘단순성’이라고 지칭하는 것은 내가 ‘단순성’이라고 지칭하는 것과 같지 않다. 어떤 이론도 경험에 의하여 분명하게 결정되지 않는다는 것이 규약주의자의 핵심적 개념이자 출발점이다; 내가 동의하는 요점. 규약주의자는, 그리하여 자신이 ‘가장 단순한’ 이론을 선택해야 한다고 믿는다. 그러나 규약주의자가 자신의 이론들을 오류로 판정될 수 있는 이론체계들로서가 아니라 오히려 규약적 약정들로서 취급하기 때문에, 규약주의자는 분명히 ‘단순성’에 의하여 오류판정 가능성의 등급과 다른 것을 의미한다.
단순성에 대한 규약주의적 개념은 정말로 부분적으로 감성학적으로 그리고 부분적으로 실제적인 것으로 판명된다. 그리하여 슐릭(Schlick)에 의한 다음 언급은 (2절 참조) 단순성에 대한 규약주의적 개념에는 적용되지만 나의 개념에는 적용되지 않는다: ‘틀림없이 항상 자의적인 규약에 의하여 단순성이라는 개념을 우리가 정의(定義)할 수 있을 따름임은 확실하다.’ 규약주의자들 자신들이 그들 자신의 근본적인 개념이 – 단순성이라는 개념 – 지닌 규약적 특징을 간과했다는 것은 기이하다. 규약주의자들이 틀림없이 그 특징을 간과했다는 것은 분명한데, 왜냐하면 그렇지 않다면 그들이 자의적 규약이라는 방식을 선택하자마자 그들이 받은 단순성의 도움은 자의적임으로부터 그들을 구원할 수 없었을 터임을 그들은 주목했을 터이기 때문이다.
나의 관점으로부터, 규약주의적 관행에 따라서 우리가 이론이 위험에 빠질 때마다 보조 가설들의 도입에 의하여 우리가 구조하기로 결심한 영구적으로 확립된 이론체계로서 그 이론체계에 집착한다면, 이론체계는 최고로 복잡한 것으로서 틀림없이 기술된다. 이유인즉 그렇게 보호되는 이론체계의 오류판정 가능성 등급은 0이기 때문이다. 그리하여 우리는 우리의 단순성 개념에 의하여 20절의 방법론적 규칙들로 되돌아가게 된다; 그리고 특히 또한 임시방편적인 가설들과 보조 가설들에 우리가 빠지는 것을 막는 저 규칙이나 원칙으로: 가설들을 사용함에서 절약의 원리로.
추가사항, 1972년
이 장(章)에서 나는, 단순성의 등급들이 얼마나 멀리 시험가능성의 등급과 일치할 수 있는지를 밝히려고 노력했다. ‘단순성’이라는 단어에 의존하는 것은 없다: 나는 단어들과 관련하여 결코 논쟁하지 않아서, 단순성의 본질을 밝히려고 노력하지 않았다. 내가 시도했던 것은 단지 이것이었다:
몇몇 위대한 과학자들과 철학자들은 단순성과 과학에 대한 단순성의 가치에 관하여 주장들을 폈다. 나는, 단순성에 관하여 말할 때 그들은 시험가능성을 염두에 두었다는 것을 우리가 추정한다면, 이 주장들 중 몇 가지가 더 잘 이해될 수 있다고 제안했다. 이것은 심지어, 푸앵카레(Poincaré)의 견해들과 상충될지라도, 그의 사례들 중 몇 가지 사례들을 설명한다.
오늘 나는 두 가지 추가 요점들을 강조해야겠다: (1) 우리는, 적어도 이론들이 해결하기로 한 문제들 중 몇 가지 문제들이 일치한다는 조건으로만, 시험가능성과 관련하여 이론들을 비교할 수 있다. (2) 임시방편적 가설들은 이런 방식으로 비교될 수 없다.
7
SIMPLICITY
There seems to be little agreement as to the importance of the so-called 'problem of simplicity'. Weyl said, not long ago, that 'the problem of simplicity is of central importance for the epistemology of the natural sciences'. 1 Yet it seems that interest in the problem has lately declined; perhaps because, especially after Weyl's penetrating analysis, there seemed to be so little chance of solving it.
Until quite recently the idea of simplicity has been used uncritically, as though it were quite obvious what simplicity is, and why it should be valuable. Not a few philosophers of science have given the concept of simplicity a place of crucial importance in their theories, without even noticing the difficulties to which it gives rise. For example, the followers of Mach, Kirchhoff, and Avenarius have tried to replace the idea of a causal explanation by that of the 'simplest description'. Without the adjective 'simplest' or a similar word this doctrine would say nothing. As it is supposed to explain why we prefer a description of the world with the help of theories to one with the help of singular statements, it seems to presuppose that theories are simpler than singular statements. Yet few have ever attempted to explain why they should be simpler, or what is meant, more precisely, by simplicity.
1 Cf. Weyl, op. cit., pp. 115 t; English edition p. 155. See also section 42 below.
122 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
If, moreover, we assume that theories are to be used for the sake of simplicity then, clearly, we should use the simplest theories. This is how Poincare, for whom the choice of theories is a matter of convention, comes to formulate his principle for the selection of theories: he chooses the simplest of the possible conventions. But which are the simplest?
41 ELIMINATION OF THE AESTHETIC AND THE PRAGMATIC CONCEPTS OF SIMPLICITY
The word 'simplicity' is used in very many different senses. Schrodinger's theory, for instance, is of great simplicity in a methodological sense, but in another sense it might well be called 'complex'. We can say of a problem that its solution is not simple but difficult, or of a presentation or an exposition that it is not simple but intricate.
To begin with, I shall exclude from our discussion the application of the term 'simplicity' to anything like a presentation or an exposition. It is sometimes said of two expositions of one and the same mathematical proof that the one is simpler or more elegant than the other. This is a distinction which has little interest from the point of view of the theory of knowledge; it does not fall within the province of logic, but merely indicates a preference of an aesthetic or pragmatic character. The situation is similar when people say that one task may be 'carried out by simpler means' than another, meaning that it can be done more easily or that, in order to do it, less training or less knowledge is needed. In all such cases the word 'simple' can be easily eliminated; its use is extra-logical .
42 THE METHODOLOGICAL PROBLEM OF SIMPLICITY
What, if anything, remains after we have eliminated the aesthetic and the pragmatic ideas of simplicity? Is there a concept of simplicity which is of importance for the logician? Is it possible to distinguish theories that are logically not equivalent according to their degrees of simplicity?
The answer to this question may well seem doubtful, seeing how little successful have been most attempts to define this concept. Schlick,
SIMPLICITY 1
for one, gives a negative answer. He says: 'Simplicity is ... a concept indicative of preferences which are partly practical, partly aesthetic in character.'1 And it is notable that he gives this answer when writing of the concept which interests us here, and which I shall call the epistemological concept of simplicity; for he continues: 'Even if we are unable to explain what is really meant by "simplicity" here, we must yet recognize the fact that any scientist who has succeeded in representing a series of observations by means of a very simple formula (e.g. by a
linear, quadratic, or exponential function) is immediately convinced that he has discovered a law.'
Schlick discusses the possibility of defining the concept of law-like regularity, and especially the distinction between 'law' and 'chance', with the help of the concept of simplicity. He finally dismisses it with the remark that 'simplicity is obviously a wholly relative and vague concept; no strict definition of causality can be obtained with its help; nor can law and chance be precisely distinguished'. 2 From this passage it becomes clear what the concept of simplicity is actually expected to achieve: it is to provide a measure of the degree of law-likeness or
regularity of events. A similar view is voiced by Feigl when he speaks of the 'idea of defining the degree of regularity or of law-likeness with the help of the concept of simplicity'.3
The epistemological idea of simplicity plays a special part in theories of inductive logic, for example in connection with the problem of the 'simplest curve'. Believers in inductive logic assume that we arrive at natural laws by generalization from particular observations. If we think of the various results in a series of observations as points plotted in a co-ordinate system, then the graphic representation of the law will be a curve passing through all these points. But through a finite number of points we can always draw an unlimited number of curves of the most diverse form. Since therefore the law is not uniquely determined by the observations, inductive logic is confronted with the problem of
deciding which curve, among all these possible curves, is to be chosen.
1 Schlick, Naturwissenschciften 19, 1931, p. 148. *I have translated Schlick's term
'pragmatischer' freely.
2 Schlick, ibid.
3 Feigl, Theorie und Erfahrung in der Physik, 1931, p. 25.
124 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
The usual answer is, 'choose the simplest curve'. Wittgenstein, for example, says: 'The process of induction consists in assuming the simplest law that can be made to harmonize with our experience.' 4 In choosing the simplest law, it is usually tacitly assumed that a linear function, say, is simpler than a quadratic one, a circle simpler than an ellipse, etc. But no reasons are given either for choosing this particular hierarchy of simplicities in preference to any other, or for believing that 'simple' laws have advantages over the less simple — apart from aesthetic and practical ones. 5 Schlick and Feigl mention 6 an unpublished paper of Natkin who, according to Schlick's account, proposes to call one curve simpler than another if its average curvature is smaller; or, according to Feigl's account, if it deviates less from a straight line. (The two accounts are not equivalent.) This definition seems to agree pretty well with our intuitions; but it somehow misses the crucial point; it
would, for example, make certain parts (the asymptotic parts) of a hyperbola much simpler than a circle, etc. And really, I do not think that the question can be settled by such 'artifices' (as Schlick calls them) . Moreover, it would remain a mystery why we should give preference to simplicity if defined in this particular way.
Weyl discusses and rejects a very interesting attempt to base simplicity on probability. 'Assume, for example, that twenty co-ordinated pairs of values (x, y) of the same function, y = f(x) lie (within the expected accuracy) on a straight line, when plotted on square graph paper. We shall then conjecture that we are faced here with a rigorous natural law, and that y depends linearly upon x. And we shall conjecture this because of the simplicity of the straight line, or because it would be so extremely improbable that just these twenty pairs of arbitrarily chosen
observations should lie very nearly on a straight line, had the law in question been a different one. If now we use the straight line for interpolation and extrapolation, we obtain predictions which go beyond what the observations tell us. However, this analysis is open to
4 Wittgenstein, op. cit., Proposition 6.363.
5 Wittgenstein's remark on the simplicity of logic (op. cit., Proposition 5.4541) which sets 'the standard of simplicity' gives no clue. Reichenbach's 'principle of the simplest curve' (Mathematische Zeitschrift 34, 1932, p. 616) rests on his Axiom of Induction (which I believe to be untenable) , and also affords no help.
6 In the places referred to.
SIMPLICITY 1
criticism. It will always be possible to define all kinds of mathematical functions which . . . will be satisfied by the twenty observations; and some of these functions will deviate considerably from the straight line. And for every single one of these we may claim that it would be extremely improbable that the twenty observations should lie just on this curve, unless it represented the true law. It is thus essential, after all, that the function, or rather the class of functions, should be offered to us, a priori, by mathematics because of its mathematical simplicity. It should be noted that this class of functions must not depend upon as many parameters as the number of observations to be satisfied.' 7 Weyl's remark that 'the class of functions should be offered to us a priori, by mathematics, because of its mathematical simplicity', and his reference to the number of parameters agree with my view (to be developed in section 43). But Weyl does not say what 'mathematical simplicity' is; and above all, he does not say what logical or epistemological advantages the simpler law is supposed to possess, compared with one that is more complex.8
The various passages so far quoted are very important, because of their bearing upon our present aim — the analysis of the epistemological concept of simplicity. For this concept is not yet precisely determined. It is therefore possible to reject any attempt (such as mine) to make this concept precise by saying that the concept of simplicity in which epistemologists are interested is really quite a different one. To such objections I could answer that I do not attach the slightest importance to the word 'simplicity'. The term was not introduced by me, and I
am aware of its disadvantages. All I do assert is that the concept of simplicity which I am going to clarify helps to answer those very
7 Weyl, op. cit., p. 1 1 6; English edition, p. 156. *When writing my book I did not know (and Weyl, no doubt, did not know when writing his) that Harold Jeffreys and Dorothy Wrinch had suggested, six years before Weyl, that we should measure the simplicity of a function by the paucity of its freely adjustable parameters. (See their joint paper in Phil. Mag. 42, 1921, pp. 369 ff.) I wish to take this opportunity to make full acknowledgement to these authors.
8 Weyl's further comments on the connection between simplicity and corroboration are also relevant in this connection; they are largely in agreement with my own views expressed in section 82, although my line of approach and my arguments are quite different; cf. note 1 to section 82, *and the new note here following (note *1 to section 43).
126 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
questions which, as my quotations show, have so often been raised by philosophers of science in connection with their 'problem of simplicity’.
43 SIMPLICITY AND DEGREE OF FALSIFIABILITY
The epistemological questions which arise in connection with the concept of simplicity can all be answered if we equate this concept with degree of falsifiability. This assertion is likely to meet with opposition;* 1 and so I shall try, first, to make it intuitively more acceptable.
*1 It was gratifying to find that this theory of simplicity (including the ideas of section 40) has been accepted at least by one epistemologist— by William Kneale, who writes in his book Probability and Induction, 1949, pp. 229 f: '. . . it is easy to see that the hypothesis which is simplest in this sense is also that which we can hope to eliminate most quickly if it is false. ... In short, the policy of assuming always the simplest hypothesis which accords with the known facts is that which will enable us to get rid of false hypotheses most quickly.' Kneale adds a footnote in which he refers to p. 116 of Weyl's book, and also to mine. But I cannot detect on this page- — of which I quoted the relevant portions in the text — or anywhere else in Weyl's great book (or in any other) even a trace of the view that the simplicity of a theory is connected with its falsifiability, i.e. with the ease of its elimination. Nor would I have written (as I did near the end of the preceding section) that Weyl 'does not say what logical or epistemological advantages the simpler law is supposed to possess' had Weyl (or anybody else known to me) anticipated my theory.
The facts are these. In his profound discussion of the problem (here quoted in section 42, text to note 7) Weyl mentions first the intuitive view that a simple curve — say, a straight line — has an advantage over a more complex curve because it might be considered a highly improbable accident if all the observations would fit such a simple curve. But instead of following up this intuitive view (which I think would have led him to see that the simpler theory is the better testable one), Weyl rejects it as not standing up to rational criticism: he points out that the same could be said of any given curve, however complex. (This argument is correct, but it does no longer hold if we consider the potential falsifiers — and their degree of composition — rather than the verifying instances.) Weyl then proceeds to discuss the paucity of the parameters as a criterion of simplicity, without connecting this in any way either with the intuitive view just rejected by him, or with anything which, like testability, or content, might explain our epistemological preference for the simpler theory.
Weyl's characterization of the simplicity of a curve by the paucity of its parameters was anticipated in 1921 by Harold Jeffreys and Dorothy Wrinch (Phil. Mag. 42, 369 ff.). But if Weyl merely failed to see what is now 'easy to see' (according to Kneale), Jeffreys actually saw — and still sees — the very opposite: he attributes to the simpler law the greater prior probability instead of the greater prior improbability. (Thus Jeffreys's and Kneale's views together may illustrate Schopenhauer's remark that the solution of a
SIMPLICITY 1
I have already shown that theories of a lower dimension are more easily falsifiable than those of a higher dimension. A law having the form of a function of the first degree, for instance, is more easily falsifiable than one expressible by means of a function of the second degree. But the latter still belongs to the best falsifiable ones among the laws whose mathematical form is that of an algebraic function. This agrees well with Schlick's remark concerning simplicity: "We should certainly be inclined to regard a function of the first degree as simpler than one of the second degree, though the latter also doubtless represents a perfectly good law ..."1
The degree of universality and of precision of a theory increases with its degree of falsifiability, as we have seen. Thus we may perhaps identify the degree of strictness of a theory — the degree, as it were, to which a theory imposes the rigour of law upon nature — with its degree of falsifiability; which shows that the latter does just what Schlick and Feigl expected the concept of simplicity to do. I
may add that the distinction which Schlick hoped to make between law and chance can also be clarified with the help of the idea of degrees of falsifiability: probability statements about sequences having chance-like characteristics turn out to be of infinite dimension (cf. section 65); not simple but complex (cf. section 58 and latter part of 59); and falsifiable only under special safeguards (section 68).
The comparison of degrees of testability has been discussed at length in sections 31 to 40. Some of the examples and other details given there can be easily transferred to the problem of simplicity. This holds especially for the degree of universality of a theory: a more universal statement can take the place of many less universal ones, and for that reason has often been called 'simpler'. The concept of the dimension of a theory may be said to give precision to Weyl's idea of using the
problem often first looks like a paradox and later like a truism.) I wish to add here that I have further developed my views on simplicity, and that in doing so I have tried hard and, I hope, not quite without success, to learn something from Kneale. Cf. appendix *x and section * 1 5 of my Postscript.
1 Schlick, Naturwissenschaften 19, 1931, p. 148 (cf. note 1 to the preceding section).
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
number of parameters to determine the concept of simplicity.*2 And by means of our distinction between a formal and a material reduction of the dimension of a theory (cf. section 40), certain possible objections to Weyl's theory can be met. one of these is the objection that the set of ellipses whose axes stand in a given ratio, and whose numerical eccentricity is given, has exactly as many parameters as the set of circles, although it is obviously less 'simple'.
Above all, our theory explains why simplicity is so highly desirable. To understand this there is no need for us to assume a 'principle of economy of thought' or anything of the kind. Simple statements, if knowledge is our object, are to be prized more highly than less simple ones because they tell us more; because their empirical content is greater; and because they are better testable.
44 GEOMETRICAL SHAPE AND FUNCTIONAL FORM
Our view of the concept of simplicity enables us to resolve a number of contradictions which up to now have made it doubtful whether this concept was of any use.
Few would regard the geometrical shape of, say, a logarithmic curve as
* 2 As mentioned in notes 7 to section 42 and * 1 to the present section, it was Harold Jeffreys and Dorothy Wrinch who first proposed to measure the simplicity of a function by the paucity of its freely adjustable parameters. But they also proposed to attach to the simpler hypothesis a greater prior probability. Thus their views can be presented by the schema
simplicity = paucity of parameters = high prior probability.
It so happens that I approached the matter from an entirely different angle. I was
interested in assessing degrees of testability, and I found first that testability can be measured by 'logical' improbability (which corresponds exactly to Jeffreys' 'prior' improbability). Then I found that testability, and thus prior improbability, can be equated with paucity of parameters; and only at the end, I equated high testability with high simplicity. Thus my view can be presented by the schema: testability =
high prior improbability = paucity of parameters = simplicity.
It will be seen that these two schemata coincide in part; but on the decisive point — probability vs. improbability — they stand in direct opposition. See also appendix *viii.
SIMPLICITY 1
particularly simple; but a law which can be represented by a logarithmic function is usually regarded as a simple one. Similarly a sine function is commonly said to be simple, even though the geometrical shape of the sine curve is perhaps not so very simple.
Difficulties like this can be cleared up if we remember the connection between the number of parameters and the degree of falsifiability, and if we distinguish between the formal and the material reduction of dimensions. (We must also remember the role of invariance with respect to transformations of the co-ordinate systems.) If we speak of the geometrical form or shape of a curve, then what we demand is invariance with respect to all transformations belonging to the group of displacements, and we may demand invariance with respect to similarity transformations; for we do not think of a geometrical figure or shape as being tied to a definite position. Consequently, if we think of the shape of a one-parametric logarithmic curve (y = log a x) as lying anywhere in a plane, then it would have five parameters (if we allow for similarity transformations). It would thus be by no means a particularly simple curve. If, on the other hand, a theory or law is represented by a logarithmic curve, then co-ordinate transformations of the kind described are irrelevant. In such cases, there is no point in either rotations or parallel displacements or similarity transformations. For a logarithmic curve as a rule is a graphic representation in which the co-ordinates cannot be interchanged. (For example, the x-axis might represent atmospheric pressure, and the y-axis height above sea-level.) For this reason, similarity transformations are equally without any significance here. Analogous considerations hold for sine oscillations along a particular axis, for example, the time axis; and for many other cases.
45 THE SIMPLICITY OF EUCLIDEAN GEOMETRY
One of the issues which played a major role in most of the discussions of the theory of relativity was the simplicity of Euclidean geometry. Nobody ever doubted that Euclidean geometry as such was simpler than any non-Euclidean geometry with given constant curvature — not to mention non-Euclidean geometries with curvatures varying from place to place.
At first sight the kind of simplicity here involved seems to have little
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
to do with degrees of falsifiability. But if the statements at issue are formulated as empirical hypotheses, then we find that the two concepts, simplicity and falsifiability, coincide in this case also.
Let us consider what experiments may help us to test the hypothesis, 'In our world, we have to employ a certain metrical geometry with such and such a radius of curvature.' A test will be possible only if we identify certain geometrical entities with certain physical objects — for instance straight lines with light rays; or points with the intersection of threads. If such an identification (a correlating definition, or perhaps an ostensive definition; cf. section 17) is adopted, then it can be shown that the hypothesis of the validity of an Euclidean light-ray-geometry is
falsifiable to a higher degree than any of the competing hypotheses which assert the validity of some non-Euclidean geometry. For if we measure the sum of the angles of a light-ray triangle, then any significant deviation from 180 degrees will falsify the Euclidean hypothesis. The hypothesis of a Bolyai-Lobatschewski geometry with given curvature, on the other hand, would be compatible with any particular measurement not exceeding 180 degrees. Moreover, to falsify this hypothesis it would be necessary to measure not only the sum of the angles, but also the (absolute) size of the triangle; and this means that in addition to angles, a further unit of measurement, such as a unit of area, would have to be defined. Thus we see that more measurements are needed for a falsification; that the hypothesis is compatible with greater variations in the results of measurements; and that it is therefore more difficult to falsify: it is falsifiable to a lesser degree. To put it in another way, Euclidean geometry is the only metric geometry with a
definite curvature in which similarity transformations are possible. In consequence, Euclidean geometrical figures can be invariant with respect to more transformations; that is, they can be of lower dimension: they can be simpler.
46 CONVENTIONALISM AND THE CONCEPT OF SIMPLICITY
What the conventionalist calls 'simplicity' does not correspond to what I call 'simplicity'. It is the central idea of the conventionalist, and also his starting point, that no theory is unambiguously determined by
SIMPLICITY 1
experience; a point with which I agree. He believes that he must therefore choose the 'simplest' theory. But since the conventionalist does not treat his theories as falsifiable systems but rather as conventional stipulations, he obviously means by 'simplicity' something different from degree of falsifiability.
The conventionalist concept of simplicity turns out to be indeed partly aesthetic and partly practical. Thus the following comment by Schlick (cf. section 42) applies to the conventionalist concept of simplicity, but not to mine: 'It is certain that one can only define the concept of simplicity by a convention which must always be arbitrary.'1 It is curious that conventionalists themselves have overlooked the conventional character of their own fundamental concept — that of simplicity. That they must have overlooked it is clear, for otherwise they would have noticed that their appeal to simplicity could never save them from arbitrariness, once they had chosen the way of arbitrary convention.
From my point of view, a system must be described as complex in the highest degree if, in accordance with conventionalist practice, one holds fast to it as a system established forever which one is determined to rescue, whenever it is in danger, by the introduction of auxiliary hypotheses. For the degree of falsifiability of a system thus protected is equal to zero. Thus we are led back, by our concept of simplicity, to the methodological rules of section 20; and especially also to that rule or principle which restrains us from indulgence in ad hoc hypotheses and
auxiliary hypotheses: to the principle of parsimony in the use of hypotheses.
Addendum, 1972
In this chapter I have tried to show how far degrees of simplicity can be identified with degrees of testability. Nothing depends on the word 'simplicity': I never quarrel about words, and I did not seek to reveal the essence of simplicity. What I attempted was merely this:
Some great scientists and philosophers have made assertions about simplicity and its value for science. I suggested that some of these
1 Schlick, ibid., p. 148.
132 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
assertions can be better understood if we assume that when speaking about simplicity they sometimes had testability in mind. This elucidates even some of Poincare's examples, though it clashes with his views.
Today I should stress two further points: (1) We can compare theories with respect to testability only if at least some of the problems they are supposed to solve coincide. (2) Ad hoc hypotheses cannot be compared in this way.
'칼포퍼 원전+번역문' 카테고리의 다른 글
과학적 발견의 논리, II부 9장 양자론에 관한 몇 가지 관찰 (0) | 2017.12.16 |
---|---|
과학적 발견의 논리, II부 8장 확률 (0) | 2017.10.08 |
과학적 발견의 논리 II부 6장 시험가능성의 등급들 (0) | 2017.06.18 |
과학적 발견의 논리, II부 5장 경험적 근거라는 문제 (0) | 2017.06.11 |
과학적 발견의 논리 II부, 3장 및 4장 (0) | 2017.05.06 |