Teorema de Cox
Oteorema de Cox,que recebe este nome em homenagem ao físico norte-americanoRichard Threlkeld Cox,é uma derivação das leis dateoria das probabilidadesa partir de um certo conjunto depostulados.Esta derivação justifica a então chamada interpretação "lógica"da probabilidade, já que as leis de probabilidade derivadas pelo teorema de Cox são aplicáveis a qualquer proposição. A probabilidade lógica, também chamada de bayesiana objetiva, é um tipo deprobabilidade bayesiana.Outras formas de bayesianismo, tais como a interpretação subjetiva, recebem outrasjustificações.
Pressupostos de Cox
[editar|editar código-fonte]Cox desejou que seu sistema satisfizesse as seguintes condições:
- Divisibilidade e comparabilidade — A plausibilidade de umaproposiçãoé umnúmero reale é dependente da informação que temos relacionada com a proposição.[1]
- Senso comum — Plausibilidades devem variar sensivelmente com a avaliação das plausibilidades no modelo.[2]
- Consistência – Se a plausibilidade de uma proposição pode ser derivada em muitas formas, todos os resultados devem ser iguais.[3]
"Senso comum"inclui consistência com alógica aristotélicano sentido de que proposições logicamente equivalentes terão a mesma plausibilidade.
Os postulados como originalmente afirmados por Cox não eram matematicamente rigorosos.[4][5]No entanto, é possível aumentar estes postulados como vários pressupostos matemáticos feitos implícita ou explicitamente por Cox para produzir uma prova válida.
A notação de Cox é:
- A plausibilidade de uma proposiçãodada alguma informação relacionadaé denotada por.
Os postulados de Cox e as equações funcionais são:
- A plausibilidade daconjunçãode duas proposições,dada alguma informação relacionada,é determinada pela plausibilidade dedadae pela dedada.Na forma de umaequação funcional:
- Por causa da natureza associativa da conjunção nalógica proposicional,a consistência com a lógica dá uma equação funcional que diz que a funçãoé uma operação bináriaassociativa.
- Adicionalmente, Cox postula que a funçãoémonótona.Todas as operações binárias associativas crescentes em números reais são isomórficas em relação à multiplicação dos números no intervalo,o que significa que há uma funçãoque mapeia as plausibilidades em relação a,tal que:
- A plausibilidade de uma proposição determina a plausibilidade danegaçãoda proposição. Isto postula a existência de uma função,tal que:
- Como "uma dupla negativa é uma afirmativa", a consistência com a lógica dá uma equação funcional:
- o que diz que a funçãoé umainvolução,isto é, é sua própria inversa.
- Além disso, Cox postula que a funçãoé monótona. As equações funcionais acima e a consistência com a lógica implicam que:
- Já queé logicamente equivalente a,também temos:
- Se, em particular,,entãoetambém e temos:
- e
- Abreviandoe,temos a equação funcional:
Implicações dos postulados de Cox
[editar|editar código-fonte]As leis de probabilidade deriváveis destes postulados são as seguintes.[6]Considerea plausibilidade da proposiçãodadaque satisfaz os postulados de Cox. Então, há uma funçãoque mapeia as plausibilidades em relação ao intervaloe um número positivo,tal que:
- A certeza é representada por.
- .
- .
É importante notar que os postulados implicam apenas estas propriedades gerais. Podemos recuperar as leis usuais de probabilidade ao configurar uma função nova, convencionalmente denotadaou,igual a.Então, obtêm-se as leis de probabilidade em uma forma mais familiar:
- A verdade certa é representada pore a falsidade certa por.
- .
- .
A segunda regra é uma regra para negação e a terceira regra é uma regra para conjunção. Dado que qualquer proposição contendo conjunção,disjunçãoe negação pode ser equivalentemente refraseada usando conjunção e negação apenas (aforma normal conjuntiva), pode-se agora manejar qualquer proposição composta.
As leis assim derivadas produzemaditividade finitade probabilidade, mas não aditividade contável. A formulação teórica da medida de Kolmogorov assume que umamedida de probabilidadeé contavelmente aditiva. Esta condição levemente mais forte é necessária para a prova de certos teoremas.
Interpretação e discussão posterior
[editar|editar código-fonte]O teorema de Cox veio a ser usado como uma das justificações para o uso da teoria da probabilidade bayesiana. A probabilidade pode ser interpretada como umsistema formalda lógica, a extensão natural da lógica aristotélica (na qual toda afirmação é verdadeira ou falsa) no domínio do raciocínio na presença deincerteza.[6]
Tem-se debatido com que intensidade o teorema exclui modelos alternativos para raciocínio sobre incerteza. Por exemplo, se certos pressupostos matemáticos "não intuitivos" fossem descartados, então, alternativas poderiam ser concebidas.[4]No entanto, foram sugeridos postulados adicionais de "senso comum" que permitiriam o relaxamento dos pressupostos em alguns casos.[1][2][3]Outras abordagens em direção semelhante já foram desenvolvidas.[7][8]
Cox formulou pela primeira vez o teorema em 1946.[9]Em 1961, estendeu o teorema com resultados adicionais e mais discussões.[10]O matemático norueguêsNiels Henrik Abelfoi creditado por ter usado pela primeira vez a equação funcional de associatividade.[6][11]O matemático húngaro-canadenseJános Aczélofereceu uma longa prova da equação de associatividade.[12]
Ver também
[editar|editar código-fonte]Referências
[editar|editar código-fonte]- ↑abArnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001).«On the foundations of Bayesianism»(PDF).AIP Conference Proceedings.Consultado em 6 de fevereiro de 2018
- ↑abArnborg, Stefan; Sjödin, Gunnar (2003).«What is the plausibility of probability?»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
- ↑abArnborg, Stefan; Sjödin, Gunnar (2000).«Bayes Rules in Finite Models»(PDF).Numerisk analys och datalogi, Kungl Tekniska Högskolan.Consultado em 6 de fevereiro de 2018
- ↑abHalpern, Joseph (1999).«A counterexample to theorems of Cox and Fine».Journal of Artificial intelligence Research.Consultado em 6 de fevereiro de 2018
- ↑Halpern, Joseph (1999).«Technical Addendum, Cox's theorem Revisited».Journal of Artificial Intelligence Research.Consultado em 6 de fevereiro de 2018
- ↑abcJaynes, Edwin (2003).Probability Theory: The Logic of Science(PDF).Cambridge: Cambridge University Press. 95 páginas.Consultado em 6 de fevereiro de 2018
- ↑Hardy, Michael.«Scaled Boolean algebras».Advances in Applied Mathematics.29(2): 243–292.doi:10.1016/s0196-8858(02)00011-8
- ↑Dupré, Maurice J.; Tipler, Frank J. (2009).«New axioms for rigorous Bayesian probability».Bayesian Analysis(em inglês).4(3): 599–606.ISSN1936-0975.doi:10.1214/09-ba422
- ↑Cox, Richard Threlkeld (1946).«Probability, Frequency and Reasonable Expectation».American Journal of Physics.Consultado em 6 de fevereiro de 2018
- ↑Cox, Richard Threlkeld (1961).The algebra of probable inference.Baltimore,: Johns Hopkins Press.ISBN9780801869822.OCLC1037825
- ↑Abel, Niels Henrik (1826).«Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist».Journal für die reine und angewandte Mathematik.Consultado em 6 de fevereiro de 2018
- ↑J., Aczél, (1966).Lectures on functional equations and their applications.New York: Academic Press.ISBN9780080955254.OCLC297771518