Jump to content
Fórum Script Brasil
  • 0

Script baseado em data mining


inca-anon

Question

Olá galera do scriptbrasil! Acompanho o fórum já tem um tempo, apesar de nunca ter publicado nada. O conteúdo do site é incrivel, já aprendi muitas coisas com a galera daqui.

É o seguinte colegas, eu precisava de uma ajuda para desenvolver um script. Na verdade queria só que me apontassem o caminho das pedras, que o resto eu me viro

Vou participar de um projeto de pesquisa da UnB, e o script que eu preciso montar é o seguinte:

ele terá que coletar dados como autor, data, número de linhas e local de publicação de COMMITS (contribuições para softwares open-source) espalhados na internet.

Andei pesquisando e vi que uma técnica que poderia ser utilizada pra isso seria a mineração de dados na web. Como que eu integraria isso ao script? Nunca desenvolvi um script desses antes, tenho experiencia com aplicaçoes PHP e banco de dados apenas...

Pensei que o script poderia ser bem simples, e eu iria manualmente de site em site, apenas executando o script pra coletar essas informaçoes.

Alguma dica galera? Esse script é possível ser desenvolvido em phyton?

Obrigado desde já!

Link to comment
Share on other sites

0 answers to this question

Recommended Posts

There have been no answers to this question yet

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Answer this question...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.



  • Forum Statistics

    • Total Topics
      152.2k
    • Total Posts
      652k
×
×
  • Create New...