칼포퍼 원전+번역문

서술의 확률과 수학적 확률은 다르다

이윤진이카루스 2023. 7. 21. 17:00

서술의 확률과 수학적 확률은 다르다.hwp
0.05MB

 

 

      서술의 확률과 수학적 확률은 다르다

 

 

III

이론의 (혹은 여하한 서술의) 내용에 대한 나의 연구는, 두 가지 서술 αb연접(conjunction)αb의 정보내용이 항상 그 연접의 구성요소 어느 것의 내용보다 더 크거나 적어도 동등할 것이라는 간단하고도 명백한 관념에 근거했다.

α금요일에 비가 올 것이다라는 서술로 하라; b토요일은 맑을 것이다라는 서술로 하라; 그러면 αb금요일에 비가 올 것이고 토요일은 맑을 것이다라는 서술로 하라: 그렇다면 마지막 서술인 연접αb의 정보내용이 그 구성요소인 α의 정보 내용과 또한 그 구성요소인 b의 정보 내용을 능가한다는 것은 명백하다. 그리고 αb 확률이 (혹은 동일하게, αb참일 확률) 그 구성요소들 어느 것의 확률보다 작을 것 또한 명백하다.

서술 α의 내용대하여 Ct(α)라고, 그리고 αb의 연접 내용에 대하여 Ct(αb)라고 서술하면, 우리는

 

(1) Ct(α) Ct(αb) Ct(b)를 얻는다.

 

이것은 다음과 같은 상응하는 확률계산의 법칙과 대조를 이루는데,

 

(2) p(α) p(αb) p(b),

 

이 법칙에서 (1)의 부등호가 거꾸로 된다. (1)(2)의 법칙을 함께 보면, 내용이 증가함에 따라서 확률은 감소하며 그 반대의 경우도 성립한다고 서술한다; 혹은 다시 말해서, 개연성이 증가함에 따라서 내용은 증가한다고 서술한다. (물론 이 분석은, 서술의 논리적 내용을 그 내용에 의하여 논리적으로 수반되는 모든 저 서술들의 집합으로서 보는 일반적인 관념과 완전히 일치한다. 서술α의 내용이 서술b의 내용보다 보다 크다면 다시 말해서, αb보다 더 많은 것을 수반한다면 서술α는 서술b보다 논리적으로 더 강력하다고 우리는 또한 말할 것이다.)

이 사소한 사실에는 다음과 같은 불가피한 결론들이 있다: 지식의 성장이 내용이 증가하는 이론들로써 우리가 조작하는 것을 의미한다면, 그것은 또한 틀림없이 확률이 감소하는 (확률계산이라는 의미에서) 이론들로써 우리가 조작하는 것을 의미한다. 그리하여 우리의 목표가 지식의 발전이나 성장이라면, 높은 확률은 (확률계산의 의미에서) 도저히 우리의 목표가 또한 될 리가 없다: 이 두 가지 목표는 양립될 수 없다.

나는 이 근본적이지만 사소한 결론을 약 30년 전에 발견했고, 그 후 그 결과를 강의하여 오고 있다. 그러나 높은 확률이 틀림없이 매우 바람직한 것이라는 편견이 매우 깊이 뿌리박혀 내가 얻은 사소한 결과는 아직도 많은 사람들에 의하여 역설적(paradoxical)’이라고 믿어진다. 이 간단한 결과에도 불구하고 높은 확률이 (확률계산의 의미에서) 틀림없이 매우 바람직한 것이라는 관념은 대부분의 사람들에게 그렇게 명백하게 보여서 그 사람들은 그 관념을 비판적으로 고려할 준비가 되어 있지 않다. 그리하여 브루스 브루크-웨이블(Bruce Brooke-Wavell) 박사는 내가 이런 문맥에서 확률을 말하는 것을 멈추어야 하고 나의 논증을 내용계산법상대적 내용계산법에 근거시켜야 한다고 나에게 제안했다; 또는 다시 말해서, 내가 비개연성을 겨냥하는 과학에 관하여 말하지 말고, 과학이 최대한의 내용을 겨냥한다고 말하기만 해야 한다고 나에게 제안했다. 나는 이 제안을 많이 생각했지만, 그 제안이 도움이 될 터라고 생각하지 않는다; 문제가 실제로 명백해질 수 있으려면 폭넓게 수용되고 깊이 뿌리박힌 확률론적 편견과의 정면충돌이 불가피해 보인다. 충분히 쉬울 터와 같이 나 자신의 이론을 내용계산이나 논리적 힘의 계산에 내가 근거시킬지라도 확률계산이, 명제들이나 서술들에 대한 그 계산의 (‘논리적’) 적용에서, 이 서술들의 논리적 약점 계산이나 내용 결핍의 계산(절대적인 논리적 약점이나 상대적인 논리적 약점의) 지나지 않음을 설명할 필요가 여전히 있을 터이다. 높은 확률이 틀림없이 과학의 목표라는 것과, 그러므로 이론들에 대한 높은 등급의 확률을 우리가 얻을 수 있는 방법이 틀림없이 귀납이론에 의하여 우리에게 설명된다고 사람들이 무비판적으로 상정(想定)하여 그렇게 일반적인 경향을 띠지 않는다면, 아마도 정면충돌은 예방될 터이다. (그리하여 확률계산법과 혼동되었던 것으로 보이는 완전히 다른 것이 진리 유사성(truthlikeness)’ , ‘박진성(迫眞性: verisimilitude)’ 있음을 지적할 필요가 있다.)

이 간단한 결과들을 피하기 위하여, 모든 종류의 다소 정교한 이론들이 고안되었다. 내가 그 이론들 중 어느 것도 성공적이지 않음을 증명했다고 나는 믿는다. 그러나 더욱 중요한 것은 그 이론들이 완전히 불필요하다는 것이다. 우리가 이론들에서 간직하고 우리가 아마도 박진성, ‘진리 유사성으로 (아래 11절 참조) 지칭할 속성은 (2)가 불가피한 정리(定理: theorem)확률 계산의 의미에서 확률이 아니라는 것을 사람들은 인정하기만 하면 된다.

우리 앞에 놓인 문제는 단어들의 문제가 아님이 주시되어야 한다. 나는 소위 확률에 개의치 않으며, 소위 확률계산이 유효한 저 등급들(degrees)을 여러분이 다른 이름으로 부를지라도 나는 개의치 않는다. 이 계산법의 잘 알려진 규칙들을 (라플라스[Laplace], 케인즈[keynes], 제프리즈[Jeffreys] 그리고 많은 다른 사람들이 언명했으며, 그에 대하여 내가 다양한 형식적 공리[公理; axiom] 체계들을 내놓았던) 충족시킬 여하한 것을 위하여 확률이라는 용어를 유보하는 것이 매우 편리하다고 나는 개인적으로 생각한다. 우리가 이 용어사용법을 수용한다면 (그런 조건으로만), 서술α의 절대확률이 그 서술의 논리적 약점 등급이거나, 정보내용의 결핍일 뿐이라는 것에, 그리고 우리가 이미 정보b를 소유하고 있다고 상정(想定)하여 서술b가 주어진 서술α의 상대적 확률은 서술α 안에 있는 새로운 정보 내용의 상대적 약점 등급이거나 상대적 결핍일 따름이라는 데 의심이 있을 수 없다.

그리하여 과학에서 우리가 높은 정보 내용을 겨냥한다면 지식의 성장이 우리가 더 많이 아는 것을, α만이라기보다는 αb를 동시에 아는 것을, 그리하여 우리 이론들의 내용 증가를 의미한다면 우리가 또한 확률계산의 의미에서 낮은 확률을 겨냥한다는 것을 우리가 인정해야 한다.

그리고 낮은 확률은 오류로 판정될 높은 확률을 의미하기 때문에, 고도의 오류판정 가능성이나 반박가능성 혹은 시험가능성이 과학의 목표 중 하나라고 사실상, 정확하게 고도의 정보 내용과 동일한 목표 귀결된다.

그러므로 잠재적 만족에 대한 기준은 시험가능성이나 비개연성이다: 고도로 시험될 수 있거나 비개연적인 이론만이 시험할 가치가 있어서, 그 이론이 엄격한 시험을 특히 실행되기 전에 그 이론에 대하여 결정적인 것으로 우리가 지적할 수 있는 저 시험들 견디어 낸다면 실제로 (잠재적으로뿐 아니라) 만족스럽다.

많은 경우 시험들의 엄격성을 객관적으로 비교하는 일이 가능하다. 우리가 가치가 있는 일임을 발견한다면, 시험들의 엄격성에 대한 척도를 정의(定義)하는 일이 심지어 가능하다. (이 저서의 부록 참조.) 동일한 방식에 의하여 우리는 이론의 설명력과 입증 등급을 정의(定義)할 수 있다.

 

IV

여기 제시된 기준이 실제로 과학의 진보를 지배한다는 논지는 역사적 사례의 도움을 받아서 쉽게 예시될 수 있다. 케플러와 갈릴레오의 이론들은 논리적으로 더 강력하고 낫게 시험될 수 있는 뉴튼 이론에 의하여 통합되고 대체되었으며, 유사하게 프레넬(Fresnel)의 이론과 패러데이(Faraday)의 이론은 맥스웰(Maxwell)의 이론에 의하여 통합되고 대체되었다. 뉴튼 이론과 맥스웰 이론은 나중에, 아인슈타인의 이론에 의하여 통합되고 대체되었다. 각각의 경우에 진보는 더 많은 정보가 있어서 논리적으로 확률이 낮은 이론을 향하여 이룩되었다: 순전히 논리적 의미에서 더 쉽게 반박될 수 있는 예측을 수행했기 때문에 더 엄격하게 시험될 수 있었던 이론을 향하여 이룩되었다.

이론에 의하여 생산되는 저 새롭고 대담하고 비개연적인 예측들을 시험해도 사실상 아론이 논박되지 않으면 그 이론은 이 엄격한 시험들에 의하여 입증된다고 언급될 수 있다. 이와 관련하여 나는 여러분에게 갈레(Galle)의 해왕성 발견, 헤르츠(Hertz)의 전자파 발견, 에딩튼(Eddington)의 일식 관측, 데이비슨(Davisson)의 극한치들(maxima)을 드 브로이(de Broglie) 파동(波動)의 간섭 주름으로 엘자서(Elsasser)가 해석한 것, 그리고 최초의 유카와 중간자(Yukawa mesons)를 파월(Powell)이 관측한 것을 상기시킬 것이다.

이 모든 발견들은 엄격한 시험들에 의한 우리의 이전 (시험되어 입증된 이론 이전) 지식에 비추어 고도로 비개연적이었던 예측들에 의한 입증들을 대표한다. 다른 중요한 발견들이, 그 발견들로 인하여 이론의 입증이 아니라 논박이 발생했을지라도, 이론을 시험하는 중에 또한 이룩되었다. 최근의 중요한 한 가지 경우는 반전성(反轉性: parity)에 대한 논박이다. 그러나 밀폐된 공간에서 촛불이 타는 동안 공기의 용적이 줄어듦을, 혹은 불타는 쇠-부스러기들의 무게가 증가함을 증명하는 라부아지에(Lavoisier)의 고전적 실험들에 의하여 연소에 대한 산소 이론이 확립되지 않는다; 그러나 그 실험들에는 열소(熱素: 플로지스톤: phlogiston) 이론을 논박하는 경향이 있다.

라부아지에의 실험들은 신중하게 고안되었다; 그러나 심지어 대부분의 소위 우연한 발견들도 근본적으로 동일한 논리적 구조를 띤다. 이유인즉 이 소위 우연한 발견들이 통상적로 의식적이거나 무의식적으로 믿어진 이론들에 대한 논박들이기 때문이다: 그 발견들은 우리의 기대 중 몇 가지가 (이 이론들에 근거한) 예기치 않게 빗나갔을 때 이룩된다. 그리하여 수은의 촉매성 속성이, 수은에 의하여 영향을 받는다고 예상되지 않던 화학 반응이 수은이 있는 상태에서 가속되는 것이 우연히 발견되었을 때, 발견되었다. 그러나 외르스테드(Oersted)의 발견과 뢴트겐(Röntgen) 발견 그리고 베크렐(Becquerel)의 발견 및 플레밍(Fleming)의 발견에도 우연적인 구성요소가 있었을지라도, 실제로 우연적이 아니었다: 이 사람들 모두는 자신이 발견한 종류의 효과를 탐색하고 있었다.

콜럼버스의 미국 대륙 발견 같은 몇 가지 발견들도 동시에 또 다른 이론을 (지구의 크기에 관한 이론과, 인도로 가는 가장 가까운 길에 관한 이론) 논박하는 반면 한 가지 이론을 (구형[球形]의 지구에 관한) 입증한다고 우리는 심지어 말할 수 있다; 그리고 그 발견들은 모든 기대들을 부정하는 정도까지 우연한 발견들이어서, 그 발견들로 인하여 논박되는 저 이론들에 대한 시험들로서 의식적으로 수행되지 않았다고 우리는 심지어 말할 수 있다.

칼 포퍼, “추측과 논박 과학적 지식의 성장”, 1989, 217-221

 

III

My study of the content of a theory (or of any statement whatsoever) was based on the simple and obvious idea that the informative content of the conjunction, ab, of any two statements, a, and b, will always be greater than, or at least equal to, that of any of its components.

Let a be the statement 'It will rain on Friday'; b the statement 'It

 

󰊔 See the discussion of degrees of testability, empirical content, corroborability, and corroboration in my L. Sc. D., especially sections 31 to 46; 82 to 85; new appendix *ix; also the discussion of degrees of explanatory power in this appendix, and especially the comparison of Einstein's and Newton's theories (in note 7 on p. 401). In what follows, I shall sometimes refer to testability, etc., as the 'criterion of progress', without going into the more detailed distinctions discussed in my book.

 

will be fine on Saturday'; and ab the statement 'It will rain on Friday and it will be fine on Saturday': it is then obvious that the informative content of this last statement, the conjunction ab, will exceed that of its component a and also that of its component b. And it will also be obvious that the probability of ab (or, what is the same, the probability that ab will be true) will be smaller than that of either of its components.

Writing Ct(a) for 'the content of the statement a', and Ct(ab) for 'the content of the conjunction a and b', we have

 

(1) Ct(a) Ct(ab) Ct(b).

 

This contrasts with the corresponding law of the calculus of probability,

 

(2) p(a) p(ab) p(b),

 

where the inequality signs of (1) are inverted. Together these two laws, (1) and (2), state that with increasing content, probability decreases, and vice versa; or in other words, that content increases with increasing improbability. (This analysis is of course in full agreement with the general idea of the logical content of statement as the class of all those statements which are logically entailed by it. We may also say that a statement a is logically stronger than a statement b if its content is greater than that of b - that is to say, if it entails more than b does.)

This trivial fact has the following inescapable consequences: if growth of knowledge means that we operate with theories of increasing content, it must also mean that we operate with theories of decreasing probability (in the sense of the calculus of probability). Thus if our aim is the advancement or growth of knowledge, then a high probability (in the sense of the calculus of probability) cannot possibly be our aim as well: these two aims are incompatible.

I found this trivial though fundamental result about thirty years ago, and I have been preaching it ever since. Yet the prejudice that a high probability must be something highly desirable is so deeply ingrained that my trivial result is still held by many to be 'paradoxical'.󰊕 Despite this simple result the idea that a high degree of probability (in the sense of the calculus of probability) must be something highly desirable seems to be so obvious to most people that they are not prepared to consider it critically. Dr Bruce Brooke-Wavell has therefore suggested to me that I should stop talking in this context of 'probability' and should base my arguments on a 'calculus of content' and of 'relative content' (이 문장에서 의미상 ofon으로 쓰여야 될 것이다. 원문의 오류로 보인다. - 역자 주); or in other words, that I should not speak about science aiming at improbability, but merely say that it aims at maximum content. I have given much thought to this suggestion, but I do not think that it would help; a head-on collision with the widely accepted and deeply ingrained

 

󰊕 See for example J. C. Harsanyi, 'Popper's improbability Criterion for the Choice of Scientific Hypotheses', Philosophy, 35, 1960, pp. 332 ff. Incidentally, I do not propose any 'criterion' for the choice of scientific hypotheses: every choice remains a risky guess. Moreover, the theoretician's choice is the hypothesis most worthy of further critical discussion (rather than of acceptance).

 

probabilistic prejudice seems unavoidable if the matter is really to be cleared up. Even if, as would be easy enough, I were to base my own theory upon the calculus of content, or of logical strength, it would still be necessary to explain that the probability calculus, in its ('logical') application to propositions or statements, is nothing but a calculus of the logical weakness or lack of content of these statements (either of absolute logical weakness or of relative logical weakness). Perhaps a head-on collision would be avoidable if people were not so generally inclined to assume uncritically that a high probability must be an aim of science, and that, therefore, the theory of induction must explain to us how we can attain a high degree of probability for our theories. (And it then becomes necessary to point out that there is something else - a 'truthlikeness' or 'verisimilitude' - with a calculus totally different from the calculus of probability with which it seems to have been confused.)

To avoid these simple results, all kinds of more or less sophisticated theories have been designed. I believe I have shown that none of them is successful. But what is more important, they are quite unnecessary. One merely has to recognize that the property which we cherish in theories and which we may perhaps call 'verisimilitude' or 'truthlikeness' (see section XI below) is not a probability in the sense of the calculus of probability of which (2) is an inescapable theorem.

It should be noted that the problem before us is not a problem of words. I do not mind what you call 'probability', and I do not mind if you call those degrees for which the so-called 'calculus of probability' holds by any other name. I personally think that it is most convenient to reserve the term 'probability' for whatever may satisfy the well-known rules of this calculus (which Laplace, Keynes, Jeffreys and many others have formulated, and for which I have given various formal axiom systems). If (and only if) we accept this terminology, then there can be no doubt that the absolute probability of a statement a is simply the degree of its logical weakness, or lack of informative content, and that the relative probability of a statement a, given a statement b, is simply the degree of the relative weakness, or the relative lack of new informative content in statement a, assuming that we are already in possession of the information b. (앞 문장에서 assuming 이하의 분사구문은 문법적 오류이다. 다르게 표현해야 한다. - 역자 주).

Thus if we aim, in science, at a high informative content - if the growth of knowledge means that we know more, that we know a and b, rather than a alone, and that the content of our theories thus increases - then we have to admit that we also aim at a low probability in the sense of the calculus of probability.

And since a low probability means a high probability of being falsified, it follows that a high degree of falsifiability, or refutability, or testability, is one of the aims of science - in fact, precisely the same aim as a high informative content.

The criterion of potential satisfactoriness is thus testability, or improbability: only a highly testable or improbable theory is worth testing, and is actually (and not merely potentially) satisfactory if it withstand severe tests - especially those tests to which we could point as crucial for the theory before they were ever undertaken.

It is possible in many cases to compare the severity of tests objectively. It is even possible, if we find it worth while, to define a measure of the severity of tests. (See the Addenda to this volume.) By the same method we can define the explanatory power and the degree of corroboration of a theory.󰊖

 

IV

 

The thesis that the criterion here proposed actually dominates the progress of science can easily be illustrated with the help of historical examples. The theories of Kepler and Galileo were unified and superseded by Newton's logically stronger and better testable theory, and similarly Fresnel's and Faraday's by Maxwell's. Newton's theory, and Maxwell's, in their turn, were unified and superseded by Einstein's. In each such case the progress was towards a more informative and therefore logically less probable theory: towards a theory which was more severely testable because it made predictions which, in a purely logical sense, were more easily refutable.

A theory which is not in fact refuted by testing those new and bold and improbable predictions to which it gives rise can be said to be corroborated by these severe tests. I may remind you in this connection of Galle's discovery of Neptune, of Hertz's discovery of electromagnetic waves, of Eddington's eclipse observations, of Elsasser's interpretation of Davisson's maxima as interference fringes of de Broglie waves, and of Powell's observations of the first Yukawa mesons.

All these discoveries represent corroborations by severe tests - by predictions which were highly improbable in the light of our previous knowledge (previous to the theory which was tested and corroborated). Other important discoveries have also been made while testing a theory, though they did not lead to its corroboration but to its refutation. A recent and important case is the refutation of parity. But Lavoisier's classical experiments which show that the volume of air decreases while a candle burns in a close space, or that the weight of burning iron-filings increases, do no establish the oxygen theory of combustion; yet they tend to refute the phlogiston theory.

Lavoisier's experiments were carefully thought out; but even most so-called 'chance-discoveries' are fundamentally of the same logical structure. For these so-called 'chance-discoveries' are as a rule refutations of theories which were consciously or unconsciously held: they are made when some of our expectations (based upon these theories) are unexpectedly disappointed. Thus the catalytic property of mercury was discovered when it was accidentally found that in its presence a chemical reaction had been speeded up which had not been expected to be influenced by mercury. But neither Oersted's nor Röntgen's nor Becquerel's nor Fleming's discoveries was really

 

󰊖 See especially appendix *ix to my L. Sc. D.

 

accidental, even though they had accidental components: every one of these men was searching for an effect of the kind he found.

We can even say that some discoveries, such as Columbus' discovery of America, corroborate one theory (of the spherical earth) while refuting at the same time another (the theory of the size of the earth, and with it, of the nearest way to India); and that they were chance-discoveries to the extent to which they contradicted all expectations, and were not consciously undertaken as tests of those theories which they refuted.