O Futebol Americano de Minas Gerais na Internet

data-miningArtigo apresentado para conclusão do Curso de Pós Graduação em Business Intelligence, pela Pontifícia Universidade Católica de Minas Gerais (PUC ­MG) – Instituto de Educação Continuada (IEC), sob orientação do  Prof. Cristiano Carvalho.
Este trabalho tem como objetivo avaliar a aplicabilidade dos resultados da obtenção, mineração de dados e estudo da relevância do tema proposto; Final do Campeonato Mineiro de Futebol Americano entre Minas Locomotiva e Get Eagles frente ao Clássico do Futebol Mineiro entre Cruzeiro e Atlético. A proposta é comparar o impacto dos dois eventos na internet, em blogs especializados, sites e mídias sociais (Twitter, Facebook).
Baseado nas etapas do processo de KDD (Knowledge Discovery in Databases). Processo, não trivial, de extração de informações implícitas, previamente desconhecidas e potencialmente úteis. O processo inicia a partir dos dados armazenados em um banco de dados, Fayyad (1996), no qual se divide resumidamente em: dados, informação e conhecimento. Utilizando aplicações que permitam a automatização total ou parcial dessas etapas.

Nos resultados, foram apontados dados como faixa etária dos leitores, leitores por região geográfica, meios de comunicação que mais publicaram sobre os eventos, relevância das ocorrências entre outros indicadores.

Clique aqui para fazer o download do artigo.

*Publicação autorizada pela PUC Minas.

 

Modelagem para Data Warehouse

Um paradigma bem interessante, sair da modelagem relacional que sempre trabalhei e focar na multidimensional.
São duas modelagens bem diferentes, com objetivos opostos.
Em suma, a modelagem relacional foca em organização.
O modelo relacional, com muitas tabelas, interligações intermináveis não atendem um DW.
Não que seja ruim ou errada, nada disso. Ela simplesmente não atende aos objetivos de um Data Warehouse.
“O objetivo de um Data Warehouse é suprir as necessidades posteriores à informatização de uma empresa de médio e grande porte. Uma empresa que se inicia pequena, gerencia suas informações de forma simples, com planilhas e documentos, pois o volume de informações é pequeno. Com o decorrer de seu crescimento e o aumento do volume de vendas ou transações, ela passa a ter a necessidade de obter sistemas de controle empresarial destinado ao seu ramo de atuação no mercado.”
(http://imasters.com.br)

O que me pega ainda, nessas primeiras semanas são os automatismos, eu começo a modelar pensando relacional.
Quando estou na quinta tabela, pensando em Chaves Estrangeiras em todas, me vem: Não pode.
Na modelagem multidimensional existem as Dimensões obviamente e as Fatos.
Dimensões são sempre chaves estrangeiras nas Fatos. Nas tabelas Fatos, ficam todo o conteúdo quantitativo e nas tabelas dimensões ficam os filtros, por qual tema poderá sera gerado o relatório.

Basicamente é assim, mas não existe uma receita de bolo, vale a regra clássica do “cada caso é um caso”.
Semana que vem eu publicarei minhas primeiras modelagens, pois assim, conseguirei estudar mais.

Modelagem e qualidade de dados

Modelagem e qualidade de dados sempre me agradou, gosto muito de modelar, arquitetar bancos de dados. Sempre começo a modelagem de um banco, pensando que ele pode e provavelmente irá evoluir. Mas claro, a pós em Business Intelligence (BI) já me mostrou que algumas das minhas verdades absolutas, não valem muito. Nada como um curso em um ambiente muito mais profissional para dar uma balançada.
Um dos pontos fortes dessa matéria, mais uma vez o professor. Carlos Barbiere (Blog) tem um currículo vasto, muito conhecimento e experiência, sem contar a sua enorme didática em sala de aula. Em poucos minutos de aula, ele desperta o interesse pelo que vai ensinar, com exemplos sempre reais e próximos da realidade dos alunos.

Um Data Warehouse (DW) de sucesso, bem estruturado e modelado vai de acordo com as escolhas corretas das estratégias a serem seguidas, de forma que sejam adequadas às necessidades que o (DW) precisa atingir.
Os conceitos de Modelagem Multidimensional, Modelagem Entidade-Relacionamento e Modelagem de Dados Corporativos podem garantia a confiabilidade dos dados e a claro, a qualidade nos resultados apresentados ao usuário.

Livro que recebi em sala e já estou lendo, a cada dia mais entusiasmado com esse mundo do BI.

A primeira aula dele na pós foi ontem, então… À leitura!

Uma foto publicada por Tiago Serra (@asdruboows) em

O retorno

Resolvi me dedicar ao blog novamente. Claro que a Pós em Business Intelligence que estou cursando tem um peso enorme nisso.
Vejo o ato de publicar algo aqui, como um meio bem prazeroso de estudar. Eu preciso pesquisar, pensar em um texto interessante e com isso, vou ganhando mais conhecimento sobre o mundo do Bi e claro, desenvolvimento de sistemas.
O que pretendo postar um texto novo por semana, tratando de assuntos importantes no universo da Business Intelligence

Com os mesmos conteúdos de sempre, mas agora com a novidade do Business Intelligence, Big Data e data warehouse. Pois agora meu mundo profissional gira em torno dos bancos de dados.

Banco de Dados

Banco de Dados ou se quiserem base de dados é um mecanismo dos mais importantes dentro dos sistemas de informação, disso, todos que trabalham com desenvolvimento já sabem.

Um banco de dados vem como uma das formas de manter um deposito de dados, que nesse momento, ainda não são tratados como informação.

Antes, o conceito de Banco de Dados era relacionado somente à computação. Mas hoje, eles estão em quase tudo que usamos durante o nosso dia, sim, em quase tudo.
Sua grade de canais na televisão, é um banco de dados. Sua agenda no relogio, também.

Mas aqui, focarei mesmo na computação, que estuda a estruturação de dados e todas as operações que possam ser realizadas sobre estes dados. Operações como consultas, calculos, relatorios e muitas outras.

Um banco de dados pode ser definido como um conjunto de dados, estruturadas. Dados, que em um momento futuro, apóis serem tratados e manipuladas por um software, serão tratados como informações.
Um banco de dados é gerenciado e mantido por meio de um sistema conhecido como Sistema Gerenciador de Banco de Dados (SGBD). Normalmente um SGBD adota um modelo para esses dados, de forma simples, em arquivos.
O modelo de dados mais adotado hoje em dia ó o modelo relacional, onde as estruturas têm a forma de tabelas, compostas por linhas e colunas.