Saltar para o conteúdo

Teorema de Cox

Origem: Wikipédia, a enciclopédia livre.

Oteorema de Cox,que recebe este nome em homenagem ao físico norte-americanoRichard Threlkeld Cox,é uma derivação das leis dateoria das probabilidadesa partir de um certo conjunto depostulados.Esta derivação justifica a então chamada interpretação "lógica"da probabilidade, já que as leis de probabilidade derivadas pelo teorema de Cox são aplicáveis a qualquer proposição. A probabilidade lógica, também chamada de bayesiana objetiva, é um tipo deprobabilidade bayesiana.Outras formas de bayesianismo, tais como a interpretação subjetiva, recebem outrasjustificações.

Pressupostos de Cox

[editar|editar código-fonte]

Cox desejou que seu sistema satisfizesse as seguintes condições:

  1. Divisibilidade e comparabilidade — A plausibilidade de umaproposiçãoé umnúmero reale é dependente da informação que temos relacionada com a proposição.[1]
  2. Senso comum — Plausibilidades devem variar sensivelmente com a avaliação das plausibilidades no modelo.[2]
  3. Consistência – Se a plausibilidade de uma proposição pode ser derivada em muitas formas, todos os resultados devem ser iguais.[3]

"Senso comum"inclui consistência com alógica aristotélicano sentido de que proposições logicamente equivalentes terão a mesma plausibilidade.

Os postulados como originalmente afirmados por Cox não eram matematicamente rigorosos.[4][5]No entanto, é possível aumentar estes postulados como vários pressupostos matemáticos feitos implícita ou explicitamente por Cox para produzir uma prova válida.

A notação de Cox é:

  • A plausibilidade de uma proposiçãodada alguma informação relacionadaé denotada por.

Os postulados de Cox e as equações funcionais são:

  • A plausibilidade daconjunçãode duas proposições,dada alguma informação relacionada,é determinada pela plausibilidade dedadae pela dedada.Na forma de umaequação funcional:

Por causa da natureza associativa da conjunção nalógica proposicional,a consistência com a lógica dá uma equação funcional que diz que a funçãoé uma operação bináriaassociativa.
  • Adicionalmente, Cox postula que a funçãoémonótona.Todas as operações binárias associativas crescentes em números reais são isomórficas em relação à multiplicação dos números no intervalo,o que significa que há uma funçãoque mapeia as plausibilidades em relação a,tal que:

  • A plausibilidade de uma proposição determina a plausibilidade danegaçãoda proposição. Isto postula a existência de uma função,tal que:

Como "uma dupla negativa é uma afirmativa", a consistência com a lógica dá uma equação funcional:

o que diz que a funçãoé umainvolução,isto é, é sua própria inversa.
  • Além disso, Cox postula que a funçãoé monótona. As equações funcionais acima e a consistência com a lógica implicam que:

Já queé logicamente equivalente a,também temos:

Se, em particular,,entãoetambém e temos:

e

Abreviandoe,temos a equação funcional:

Implicações dos postulados de Cox

[editar|editar código-fonte]

As leis de probabilidade deriváveis destes postulados são as seguintes.[6]Considerea plausibilidade da proposiçãodadaque satisfaz os postulados de Cox. Então, há uma funçãoque mapeia as plausibilidades em relação ao intervaloe um número positivo,tal que:

  1. A certeza é representada por.
  2. .
  3. .

É importante notar que os postulados implicam apenas estas propriedades gerais. Podemos recuperar as leis usuais de probabilidade ao configurar uma função nova, convencionalmente denotadaou,igual a.Então, obtêm-se as leis de probabilidade em uma forma mais familiar:

  1. A verdade certa é representada pore a falsidade certa por.
  2. .
  3. .

A segunda regra é uma regra para negação e a terceira regra é uma regra para conjunção. Dado que qualquer proposição contendo conjunção,disjunçãoe negação pode ser equivalentemente refraseada usando conjunção e negação apenas (aforma normal conjuntiva), pode-se agora manejar qualquer proposição composta.

As leis assim derivadas produzemaditividade finitade probabilidade, mas não aditividade contável. A formulação teórica da medida de Kolmogorov assume que umamedida de probabilidadeé contavelmente aditiva. Esta condição levemente mais forte é necessária para a prova de certos teoremas.

Interpretação e discussão posterior

[editar|editar código-fonte]

O teorema de Cox veio a ser usado como uma das justificações para o uso da teoria da probabilidade bayesiana. A probabilidade pode ser interpretada como umsistema formalda lógica, a extensão natural da lógica aristotélica (na qual toda afirmação é verdadeira ou falsa) no domínio do raciocínio na presença deincerteza.[6]

Tem-se debatido com que intensidade o teorema exclui modelos alternativos para raciocínio sobre incerteza. Por exemplo, se certos pressupostos matemáticos "não intuitivos" fossem descartados, então, alternativas poderiam ser concebidas.[4]No entanto, foram sugeridos postulados adicionais de "senso comum" que permitiriam o relaxamento dos pressupostos em alguns casos.[1][2][3]Outras abordagens em direção semelhante já foram desenvolvidas.[7][8]

Cox formulou pela primeira vez o teorema em 1946.[9]Em 1961, estendeu o teorema com resultados adicionais e mais discussões.[10]O matemático norueguêsNiels Henrik Abelfoi creditado por ter usado pela primeira vez a equação funcional de associatividade.[6][11]O matemático húngaro-canadenseJános Aczélofereceu uma longa prova da equação de associatividade.[12]

  1. abArnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001).«On the foundations of Bayesianism»(PDF).AIP Conference Proceedings.Consultado em 6 de fevereiro de 2018
  2. abArnborg, Stefan; Sjödin, Gunnar (2003).«What is the plausibility of probability?»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
  3. abArnborg, Stefan; Sjödin, Gunnar (2000).«Bayes Rules in Finite Models»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
  4. abHalpern, Joseph (1999).«A counterexample to theorems of Cox and Fine».Journal of Artificial intelligence Research.Consultado em 6 de fevereiro de 2018
  5. Halpern, Joseph (1999).«Technical Addendum, Cox's theorem Revisited».Journal of Artificial Intelligence Research.Consultado em 6 de fevereiro de 2018
  6. abcJaynes, Edwin (2003).Probability Theory: The Logic of Science(PDF).Cambridge: Cambridge University Press. 95 páginas.Consultado em 6 de fevereiro de 2018
  7. Hardy, Michael.«Scaled Boolean algebras».Advances in Applied Mathematics.29(2): 243–292.doi:10.1016/s0196-8858(02)00011-8
  8. Dupré, Maurice J.; Tipler, Frank J. (2009).«New axioms for rigorous Bayesian probability».Bayesian Analysis(em inglês).4(3): 599–606.ISSN1936-0975.doi:10.1214/09-ba422
  9. Cox, Richard Threlkeld (1946).«Probability, Frequency and Reasonable Expectation».American Journal of Physics.Consultado em 6 de fevereiro de 2018
  10. Cox, Richard Threlkeld (1961).The algebra of probable inference.Baltimore,: Johns Hopkins Press.ISBN9780801869822.OCLC1037825
  11. Abel, Niels Henrik (1826).«Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist».Journal für die reine und angewandte Mathematik.Consultado em 6 de fevereiro de 2018
  12. J., Aczél, (1966).Lectures on functional equations and their applications.New York: Academic Press.ISBN9780080955254.OCLC297771518