Teorema de Cox

Oteorema de Cox,que recebe este nome em homenagem ao físico norte-americanoRichard Threlkeld Cox,é uma derivação das leis dateoria das probabilidadesa partir de um certo conjunto depostulados.Esta derivação justifica a então chamada interpretação "lógica"da probabilidade, já que as leis de probabilidade derivadas pelo teorema de Cox são aplicáveis a qualquer proposição. A probabilidade lógica, também chamada de bayesiana objetiva, é um tipo deprobabilidade bayesiana.Outras formas de bayesianismo, tais como a interpretação subjetiva, recebem outrasjustificações.

Pressupostos de Cox

Cox desejou que seu sistema satisfizesse as seguintes condições:

Divisibilidade e comparabilidade — A plausibilidade de umaproposiçãoé umnúmero reale é dependente da informação que temos relacionada com a proposição.^[1]
Senso comum — Plausibilidades devem variar sensivelmente com a avaliação das plausibilidades no modelo.^[2]
Consistência – Se a plausibilidade de uma proposição pode ser derivada em muitas formas, todos os resultados devem ser iguais.^[3]

"Senso comum"inclui consistência com alógica aristotélicano sentido de que proposições logicamente equivalentes terão a mesma plausibilidade.

Os postulados como originalmente afirmados por Cox não eram matematicamente rigorosos.^[4]^[5]No entanto, é possível aumentar estes postulados como vários pressupostos matemáticos feitos implícita ou explicitamente por Cox para produzir uma prova válida.

A notação de Cox é:

A plausibilidade de uma proposição $A$ dada alguma informação relacionada $X$ é denotada por $A|X$ .

Os postulados de Cox e as equações funcionais são:

A plausibilidade daconjunção $AB$ de duas proposições $A,B$ ,dada alguma informação relacionada $X$ ,é determinada pela plausibilidade de $A$ dada $X$ e pela de $B$ dada $AX$ .Na forma de umaequação funcional:
$AB|X=g(A|X,B|AX).$

Por causa da natureza associativa da conjunção nalógica proposicional,a consistência com a lógica dá uma equação funcional que diz que a função

g

é uma operação bináriaassociativa.

Adicionalmente, Cox postula que a função $g$ émonótona.Todas as operações binárias associativas crescentes em números reais são isomórficas em relação à multiplicação dos números no intervalo $[0,1]$ ,o que significa que há uma função $w$ que mapeia as plausibilidades em relação a $[0,1]$ ,tal que:
$w(AB|X)=w(A|X)w(B|AX).$
A plausibilidade de uma proposição determina a plausibilidade danegaçãoda proposição. Isto postula a existência de uma função $f$ ,tal que:
$w(n{\tilde {a}}o\,A|X)=f(w(A|X)).$

Como "uma dupla negativa é uma afirmativa", a consistência com a lógica dá uma equação funcional:

$f(f(x))=x,$

o que diz que a função

f

é umainvolução,isto é, é sua própria inversa.

Além disso, Cox postula que a função $f$ é monótona. As equações funcionais acima e a consistência com a lógica implicam que:
$w(AB|X)=w(A|X)f(w(n{\tilde {a}}o\,B|AX))=w(A|X)f\left({w(A\,n{\tilde {a}}o\,B|X) \over w(A|X)}\right).$

Já que

AB

é logicamente equivalente a

BA

,também temos:

$w(A|X)f\left({w(A\,n{\tilde {a}}o\,B|X) \over w(A|X)}\right)=w(B|X)f\left({w(B\,n{\tilde {a}}o\,A|X) \over w(B|X)}\right).$

Se, em particular,

B=n{\tilde {a}}o\,(AD)

,então

A\,n{\tilde {a}}o\,B=n{\tilde {a}}o\,B

e

B\,n{\tilde {a}}o\,A=n{\tilde {a}}o\,A

também e temos:

$w(A\,n{\tilde {a}}o\,B|X)=w(\,n{\tilde {a}}o\,B|X)=f(w(B|X))$

e

$w(B\,n{\tilde {a}}o\,A|X)=w(\,n{\tilde {a}}o\,A|X)=f(w(A|X)).$

Abreviando

w(A|X)=x

e

w(B|X)=y

,temos a equação funcional:

$xf\left({f(y) \over x}\right)=yf\left({f(x) \over y}\right).$

Implicações dos postulados de Cox

As leis de probabilidade deriváveis destes postulados são as seguintes.^[6]Considere $A|B$ a plausibilidade da proposição $A$ dada $B$ que satisfaz os postulados de Cox. Então, há uma função $w$ que mapeia as plausibilidades em relação ao intervalo $[0,1]$ e um número positivo $m$ ,tal que:

A certeza é representada por $w(A|B)=1$ .
$w^{m}(A|B)+w^{m}(\,n{\tilde {a}}o\,A|B)=1$ .
$w(AB|C)=w(A|C)w(B|AC)=w(B|C)w(A|BC)$ .

É importante notar que os postulados implicam apenas estas propriedades gerais. Podemos recuperar as leis usuais de probabilidade ao configurar uma função nova, convencionalmente denotada $P$ ou $\Pr$ ,igual a $w^{m}$ .Então, obtêm-se as leis de probabilidade em uma forma mais familiar:

A verdade certa é representada por $\Pr(A|B)=1$ e a falsidade certa por $\Pr(A|B)=0$ .
$\Pr(A|B)+\Pr(\,n{\tilde {a}}o\,A|B)=1$ .
$\Pr(AB|C)=\Pr(A|C)\Pr(B|AC)=\Pr(B|C)\Pr(A|BC)$ .

A segunda regra é uma regra para negação e a terceira regra é uma regra para conjunção. Dado que qualquer proposição contendo conjunção,disjunçãoe negação pode ser equivalentemente refraseada usando conjunção e negação apenas (aforma normal conjuntiva), pode-se agora manejar qualquer proposição composta.

As leis assim derivadas produzemaditividade finitade probabilidade, mas não aditividade contável. A formulação teórica da medida de Kolmogorov assume que umamedida de probabilidadeé contavelmente aditiva. Esta condição levemente mais forte é necessária para a prova de certos teoremas.

Interpretação e discussão posterior

O teorema de Cox veio a ser usado como uma das justificações para o uso da teoria da probabilidade bayesiana. A probabilidade pode ser interpretada como umsistema formalda lógica, a extensão natural da lógica aristotélica (na qual toda afirmação é verdadeira ou falsa) no domínio do raciocínio na presença deincerteza.^[6]

Tem-se debatido com que intensidade o teorema exclui modelos alternativos para raciocínio sobre incerteza. Por exemplo, se certos pressupostos matemáticos "não intuitivos" fossem descartados, então, alternativas poderiam ser concebidas.^[4]No entanto, foram sugeridos postulados adicionais de "senso comum" que permitiriam o relaxamento dos pressupostos em alguns casos.^[1]^[2]^[3]Outras abordagens em direção semelhante já foram desenvolvidas.^[7]^[8]

Cox formulou pela primeira vez o teorema em 1946.^[9]Em 1961, estendeu o teorema com resultados adicionais e mais discussões.^[10]O matemático norueguêsNiels Henrik Abelfoi creditado por ter usado pela primeira vez a equação funcional de associatividade.^[6]^[11]O matemático húngaro-canadenseJános Aczélofereceu uma longa prova da equação de associatividade.^[12]

Ver também

Referências

↑^a^bArnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001).«On the foundations of Bayesianism»(PDF).AIP Conference Proceedings.Consultado em 6 de fevereiro de 2018
↑^a^bArnborg, Stefan; Sjödin, Gunnar (2003).«What is the plausibility of probability?»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
↑^a^bArnborg, Stefan; Sjödin, Gunnar (2000).«Bayes Rules in Finite Models»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
↑^a^bHalpern, Joseph (1999).«A counterexample to theorems of Cox and Fine».Journal of Artificial intelligence Research.Consultado em 6 de fevereiro de 2018
↑Halpern, Joseph (1999).«Technical Addendum, Cox's theorem Revisited».Journal of Artificial Intelligence Research.Consultado em 6 de fevereiro de 2018
↑^a^b^cJaynes, Edwin (2003).Probability Theory: The Logic of Science(PDF).Cambridge: Cambridge University Press. 95 páginas.Consultado em 6 de fevereiro de 2018
↑Hardy, Michael.«Scaled Boolean algebras».Advances in Applied Mathematics.29(2): 243–292.doi:10.1016/s0196-8858(02)00011-8
↑Dupré, Maurice J.; Tipler, Frank J. (2009).«New axioms for rigorous Bayesian probability».Bayesian Analysis(em inglês).4(3): 599–606.ISSN 1936-0975.doi:10.1214/09-ba422
↑Cox, Richard Threlkeld (1946).«Probability, Frequency and Reasonable Expectation».American Journal of Physics.Consultado em 6 de fevereiro de 2018
↑Cox, Richard Threlkeld (1961).The algebra of probable inference.Baltimore,: Johns Hopkins Press.ISBN 9780801869822.OCLC 1037825
↑Abel, Niels Henrik (1826).«Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist».Journal für die reine und angewandte Mathematik.Consultado em 6 de fevereiro de 2018
↑J., Aczél, (1966).Lectures on functional equations and their applications.New York: Academic Press.ISBN 9780080955254.OCLC 297771518

[:0-1] Arnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001).«On the foundations of Bayesianism»(PDF).AIP Conference Proceedings.Consultado em 6 de fevereiro de 2018

[:1-2] Arnborg, Stefan; Sjödin, Gunnar (2003).«What is the plausibility of probability?»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018

[:2-3] Arnborg, Stefan; Sjödin, Gunnar (2000).«Bayes Rules in Finite Models»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018

[:3-4] Halpern, Joseph (1999).«A counterexample to theorems of Cox and Fine».Journal of Artificial intelligence Research.Consultado em 6 de fevereiro de 2018

[5] Halpern, Joseph (1999).«Technical Addendum, Cox's theorem Revisited».Journal of Artificial Intelligence Research.Consultado em 6 de fevereiro de 2018

[:4-6] Jaynes, Edwin (2003).Probability Theory: The Logic of Science(PDF).Cambridge: Cambridge University Press. 95 páginas.Consultado em 6 de fevereiro de 2018

[7] Hardy, Michael.«Scaled Boolean algebras».Advances in Applied Mathematics.29(2): 243–292.doi:10.1016/s0196-8858(02)00011-8

[8] Dupré, Maurice J.; Tipler, Frank J. (2009).«New axioms for rigorous Bayesian probability».Bayesian Analysis(em inglês).4(3): 599–606.ISSN 1936-0975.doi:10.1214/09-ba422

[9] Cox, Richard Threlkeld (1946).«Probability, Frequency and Reasonable Expectation».American Journal of Physics.Consultado em 6 de fevereiro de 2018

[10] Cox, Richard Threlkeld (1961).The algebra of probable inference.Baltimore,: Johns Hopkins Press.ISBN 9780801869822.OCLC 1037825

[11] Abel, Niels Henrik (1826).«Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist».Journal für die reine und angewandte Mathematik.Consultado em 6 de fevereiro de 2018

[12] J., Aczél, (1966).Lectures on functional equations and their applications.New York: Academic Press.ISBN 9780080955254.OCLC 297771518

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]