quarta-feira, 25 de junho de 2008

Pesquisa: Mineiros fazem mais sexo que cariocas

Essa pesquisa foi publicada no sit do globo online dia 24/6/2008. E a materia pode ser acessada AQUI

O que me chamou a atencao, alem do titulo da materia, foi a forma que os resultados foram divulgados. Disseram que foi 1715 pessoas responderam o questionario, mas nao disseram como as 1715 selecionadas foram selecionadas, o que invalidar toda a conclusao da pesquisa. Embora eu acredite que as pessoas foram slecionadas segundo algum criterio amostral, mesmo que seja amostragem quotas (que nao e' probabilistica), mas deve ser citado.

Varias comparacoes foram feitas, e uma delas ate' deu o titulo da materia. Mas nem um desvio padrao foi apresentado. Poo exemplo, pode ser que o numero medio de relacoes sexuais dos dois grupos sejam estatisticamente iguais. E para terminar, nao ficou claro quem sao os grupos. Sao mineiros e cariocas, como sugerido na materia, ou moradores de Minas e moradores do Rio. Pois como a gente sabe, BH e Rio, principalmente o Rio, tem gente do pais todo.

Bom, eu acredito que a pesquisa tenha sido feito de forma correta, ou pelo bem proximo do que esperado de uma pesquisa. Por outro lado, a divulgacao e' muito pobre, eu ate' entendo que muita gente nao vai entender termos estatisticos, mas eles nao podm ser ignorados. E obviamente, isso nao se aplica a essa pesquisa somente, acho que a grande maioria das pesquisas que sao apresentadas em meios de comunicacao sofrem desse mal da pessima divulgacao da parte estatistica.

Ate' proxima!

PS: Desculpa ai pela falta de acentuacao (teclado britanico, e eu com preguica de configura-lo)

sábado, 21 de junho de 2008

R

Esse post e' basicamente um compilado das informacoes sobre o R que apareceram em discussoes na Comunidade Estatistica Brasil no Orkut (cmm=115167*). Aqui vamos tentar fazer um resumo sobre o R contendo algum material informativo para quem trabalha com ele.

* Voce precisa ter conte no Orkut para visualizar a comunidade.

Descricao do site do R:

R is a free software environment for statistical computing and graphics. It runs on a wide variety of UNIX platforms, Windows and MacOS.


Links sobre o projeto R:



Manuais e Cursos Online



Material Extra


  • Tinn-R e' um editor de texto leve, simples e eficiente para quem trabalha com o R, vale a pena usa-lo:

  • ESS - Emacs Speaks Statistics - Para quem usa o emacs, o ESS e' uma interface que une o emacs (um poderoso editor de texto) com o R.




O que puder ser acrescentado aqui seria otimo, deixe um recado que eu (ou alguem do Blog) edita o post para deixa-lo mais informativo.

T+

terça-feira, 17 de junho de 2008

Homem Normal !! O Super Herói Estatístico!!!

Esta história foi criada por Carlos Raphael, bacharel em Estatística pela UFRN e Mestre em Estatística pela UFPE. Tomado pela inspiração após o término do mestrado, ele preparou essa obra prima para quem quiser rir um pouco sobre as coisas da Estatística. Achei bem legal, por isso achei bom postar isso aqui no blog também. Vamos à história....


Homem Normal e Beta Girl: buscando o Parâmetro Desconhecido, sempre em defesa da Lei dos Grandes Números.

Essa história se passa numa cidade não tão pequena nem tão grande assim, por isso mesmo chamada de Cidade Média, que foi atingida por uma terrível tempestade (um sério temporal). Naquele instante um acidente cósmico ocorria no espaço paramétrico, resíduos radioativos caíam por toda parte e uma nuvem de pontos cobria os céus...

Ao entrar em contato com uma amostra desses resíduos, o jovem Ted Student, que fazia apenas um passeio aleatório, adquiriu o Poder do Teste, com o qual ele consegue identificar um sujeito culpado no meio da população, desprezando assim a hipótese nula de inocência. Após a obtenção de Super Poderes Simplesmente Sensacionais (SPSS), Ted Student passou a combater o crime, tendo que dividir o tempo com o trabalho e os estudos. À medida que a noite se aproxima e ele vai ganhando graus de liberdade, Ted Student converge para o Homem Normal e precisa esconder sua matriz identidade secreta. Para isso ele conta com a ajuda de sua companheira Roberta Completa (da famosa família Completa), que assume o codinome de Beta Girl, mas continua discreta. Beta Girl criou para eles os Uniformes 01: à prova d'água, de fogo, de balas e à prova de erros.

O Homem Normal montou seu esconderijo na Ruína do Jogador, onde ele pode tomar suas decisões através de procedimentos complexos envolvendo uma roleta e cartas de um baralho honesto... É também na Ruína do Jogador que fica o Auto Regressivo e a Média Móvel: o carro e a moto do Homem Normal e da Beta Girl, respectivamente. Os super veículos podem atingir altíssimas velocidades (sempre acima do limite inferior de Crámer-Rao), possuem um sistema de amortecimento exponencial que permite a locomoção em qualquer terreno (desde um plano levemente inclinado até um plano hiperbólico), e têm também uma função característica deles, que modifica o carro e a moto conjuntamente em um robô gigante: o ARMA-X (uma espécie de Transformer de Fourier). O ruído dos motores pode ser ouvido a uma longa distância (RRRRR!).

Os criminosos que cometem o erro do tipo I e do tipo II são levados para a cadeia de Markov e enfrentam um processo Markoviano de salto. Essa prisão de verossimilhança máxima, localizada no topo do Monte carlo, já observou mais de 10000 bandidos tentarem fugir, mas o grande dilema do prisioneiro que lá se encontra é saber que a fuga é possível, porém a morte é quase certa.

A maioria dos bandidos vêm da região de rejeição, uma parte da cidade dominada pelo vício e pelo erro, onde é comum encontrar boates de strip-plot, pesquisadores fazendo experimentos para descobrir se o efeito da droga A é realmente melhor que o da droga B, ou se são pelo menos baseados em estimadores consistentes... Porém o grande problema do Homem Normal é o surgimento de supervilões, como o Doutor Assimétrico (que tenta levar tudo para um só lado: o lado do mau), Chebyshevil (sempre pregando a desigualdade em toda parte), o terrível Jack Knife (um assassino em série que elimina suas vítimas uma por uma), e Dark Cauchy (um fdp imprevisível, sem esperanças e que pode assumir muitas formas devido à sua variância infinita).

Geralmente os malfeitores entram em ação quando menos se espera, pois trabalham contra todas as probabilidades. Isso ocorre quando Ted-Student aproveita seu tempo livre comendo um gráfico de pizza (às vezes de torta), ou se diverte com a Teoria dos Jogos. Nessas situações é possível que Roberta Completa esteja em algum evento raro, com modelos expondo ANOVA tendência da moda que fará sucesso nas próximas estações, ou esteja passeando com o seu cachorrinho de estimação, Pontual (que recebe a todos com uma carinhosa lambda). Existe ainda uma razão de chance de eles saírem conjuntamente para algum show de Cantor (um músico da Cidade Média, que tem uma função singular: "cantar"). Quando os crimes acontecem, o Homem Normal ouve um ruído branco de alerta, e o maior risco está em locais como o Banco de Dados e o Museu da Falta de Memória, que guarda relíquias de p-valor inestimável, como a caixa de bigodes, a máquina geradora de momentos, uma tabela de números aleatórios, e até os instrumentos de pesca do lendário Fisher.

Ao se deparar com um inimigo, o Homem Normal trata de dar um chute inicial
(que às vezes passa longe, é verdade, mas com a prática tem acertado cada vez mais), usando em seguida o seu raio hipergeométrico. Enquanto isso, a Beta Girl ataca com lançamentos de moedas em pontos críticos do corpo, e arremessa uma rede neural sobre o adversário causando terríveis convoluções.

Quando passa o efeito ativo da rede neural, o indivíduo tem uma sensação de
continuidade no vazio e perda de auto-valor, que o impede de racionalizar direito, e então sua convergência maligna é dominada pelos heróis. Em seguida, o bandido recebe uma variável indicadora que o diferencia da população ao seu redor, mas às vezes dependendo do comportamento, o antigo malfeitor pode se integrar novamente à sociedade. O atual Caçador Hunter passou por uma situação dessas e hoje também colabora na proteção da Cidade Média com sua Espada Fatorial que, quando ataca com um corte transversal, faz um som peculiar ("SAS! SAS!"), e provoca uma decomposição espectral no adversário, levando-o ao limite da dor.

Além de proteger a Lei dos Grandes Números, combatendo o crime, o Homem Normal precisa encontrar o Parâmetro Desconhecido, um artefato legendário que possui todas as informações da população e permite prever o futuro. Se cair em mãos erradas, o Parâmetro pode gerar previsões não confiáveis e levar a um futuro sombrio e sinistro. Atualmente, tudo que se sabe sobre ele está registrado em um disco (o BLUE Ray) deixado por Mr. Omega (o misterioso cientista responsável pelas pesquisas no espaço paramétrico, que desapareceu no dia do temporal). Mas os textos contidos no BLUE Ray estão escritos em forma de quadrados latinos de difícil interpretação.

Voltando para casa, Ted Student ainda precisa dar satisfação aos seus pais, Gauss e Norma (um cara e uma coroa que têm uma correlação muito boa), e conviver com as v.a.'s que formam a família Exponencial: Mediana (sua irmã mais velha, que é 'v'endedora 'a'mbulante), Bayesiano (seu irmão mais novo, um 'v'agabundo 'a'dolescente), Chico Andrade (seu tio 'v'iciado no 'á'lcool) e Alphazema (sua avó, uma 'v'elha 'a'nciã, para a qual ele costuma trazer q-bouquets de flores de t-pétalas).

À posteriori! No próximo capítulo, Homem Normal e Beta Girl encontram Borel Boy que assumiu o controle da Sigma-Álgebra e pretende disparar a Lebesgue Gun no domínio dos Reais! E como se a estatística não fosse suficiente, Dark Cauchy ataca novamente, retirando (sem reposição) n bolas das urnas para interferir no resultado das eleições! E agora, Homem Normal? A Cidade Média conta com você (com 95% de confiança)! Pelo Método dos Momentos!

Estatistica no Futebol

Claro que tem muita coisa a se nessa area, mas eu gostaria de mencionar alguns trabalhos que eu vi na area:

O primeiro e' o site Chance de Gol, que e' um site do terra atualizado por Marcelo Arruda que e' estatistico e mestre em estatistica pela USP. E a base das previsoes dos resultados no seu site sao feitas por um modelo feito por ele durante o seu mestrado na base. (Gostei do ranking pois mostra o Cruzeiro em primeiro)

Outro site interessante, e' do UEFA 2008 Norwegian Computing Center
, la' os autores usam um modelo Poisson relativamente simples, e baseado em simulacoes, apresentam aas probabilidades de cada time ser campeao, ou simplesmente de cada ganhar, empatar ou perder um particular jogo. (A simulacao deles esta' bem coerente com o meu chute, que seria a Holanda como campea.)

E o ultimo e' site Understanding Uncertainty que apresenta uma simulacao do campeonato Ingles. O Site e' atualizado pelo professor David Spieghalter de Cambridge.

Fazer previsao em futebol, e' algo muito complicado. Pois a gente sabe que muitas vezes nao da logica, ou em estattiquis, a variabilidade e' muito alta. Esse e' o charme do futebol. Mas a estatistica pode ser usada de forma eficiente no futebol m outras areas como por exemplo:

  • Desempenho individual de jogadores: Onde a gente pode estudar evolucao de um particular jogador segundo suas estatisticas individuais. Passes errados, chutes a gol, etc.

  • Tempo de duracao de um tecnico: A metodologia aqui e' obvia, analise de sobrevivencia. Onde a gente pode estudar fatores que fazem um tecnico deixar um clube, e consequentemente indicar aqueles que estao ou nao com a corda no pescoco.

  • Uma analise estatistica da estrategia do time rival: Nessa caso a gente podia usar metodos espaciais, por exemplo olhando espacialmente onde foram feitas as principais jogadas do time rival nos ultimos jogos, assim identificando padroes e tentando anular esse comportamento em no jogo.


  • Bom, isso foi so' um lancamento de ideias de estatistica usada no futebol. Voces imaginam outras aplicacoes? Tem outras referencias?

    Abracao,
    Leo [Hajime]