Ciência de dados

Data Science ou ciência de dados, é uma área de computação que se concentra em extrair informações valiosas de grandes quantidades de dados.

Categoria de Tecnologia

Postado em 24 março 2022

Atualizado em 27 dezembro 2022

Palavras-chave: ciencia,de,dados,ciência,de,dados,data,science,análise,matemática,matematica,machine,learning,aprendizado,de,máquina

Visualizações: 1076

A computação tem ficado mais presente na vida das pessoas nesses últimos anos. Seja uma pessoa individual ou empresa, o acesso a hardwares e softwares de extrema utilidade tem se tornado mais fácil.

Essa acessibilidade permitiu que quase qualquer pessoa possa obter um computador que se conecta com a internet, aumentando a população de usuários que surfam na internet.

Hoje em dia, muita coisa foi digitalizada, possibilitando atividades como transições, negócios e investimentos online. Tudo isso trouxe muitas oportunidades na internet, uma vez que dados coletados a partir do histórico de cada usuário pode trazer grandes pistas sobre a tendência de um certo grupo de usuários.

Com o objetivo de utilizar esses dados de modo favorável, a ciência de dados surgiu.

O que é a ciência de dados?

Ciência de dados mistura técnicas de programação, matemática e análise estatística para criar algoritmos capazes de extrair dados de extrema utilidade a partir de dados passados para tomar decisões fundamentadas e aumentar compreensão de máquinas em relação aos dados. Seu foco é extrair conhecimento, diferentes percepções e interpretações de grandes conjuntos de dados.

A ciência de dados trabalha com dados estruturados, semi-estruturados e dados não estruturados. Isso inclui técnicas de aprendizado de máquina, mineração de dados, análise estatística e visualização de dados. Dados coletados da internet ou de dispositivos IoT são utilizados como base, trazendo resultados de dados analíticos, que podem ajudar na solução de problemas em vários aspectos como:

  • Saber a tendência dos clientes na compra de algum produto
  • Compreender melhor as vendas de cada dia, evitando excesso de fabricação de produtos e prejuízos consequentes
  • Analisar as vendas de outros ângulos

ciencia de dados

Onde a ciência de dados é utilizada?

A ciência de dados pode ser integrada com outras tecnologias, como banco de dados ou tecnologias de nuvem, para o armazenamento de dados coletados e informações processadas. Linguagens de programação como python e SQL são usadas com bastante frequência para o desenvolvimento de programas de ciência de dados e práticas isoladas como coleta, limpeza, exploração e análise de dados.

Além disso, problemas recentes como rápido crescimento de dados complexos na internet fizeram com que a ciência de dados se tornasse ainda mais importante. A quantidade de dados digitais gerados em todo o mundo já é muito maior do que antes. Assim, a necessidade de ferramentas e técnicas para lidar com esses dados de maneira eficiente aumentou. A ciência de dados fornece ferramentas e técnicas que permitem a extração de valor de grandes quantidades de dados.

Os dados analíticos obtidos com a ciência de dados, tem várias formas de serem usados na prática, como:

  • Criação de estatísticas
  • Previsões do futuro
  • Machine learning

Criação de estatísticas

Criar gráficos a partir de dados coletados, permitindo a visualização dessa informação de vários aspectos e integrando outras funcionalidades como filtragem, agrupamento e assimilação de dados.

Previsões do futuro

Contrói previsões do futuro usando dados passados como base. Com isso é possível identificar fenômenos padrões, como desastres que acontecem em um certo intervalo de tempo ou previsão de grande número de compras devido a um feriado.

Machine learning

Integra técnicas de machine learning com ciência de dados, trazendo melhores soluções do que soluções estabelecidas por humanos. A integração de tecnologias mais avançadas como aprendizagem profunda também é totalmente possível.

Implementar ciência de dados trará bons resultados?

Nem toda extração de dados necessariamente trará bons resultados. O modo de extração de dados depende muito do objetivo ao ser alcançado e da habilidade do especialista em ciências de dados. Uma boa comunicação entre a empresa e o analista é necessário para o entendimento de como esses dados podem ajudar a empresa de um modo positivo.

Outros desafios que a ciência de dados enfrenta é a necessidade de espaço de armazenamento para uma grande quantidade de dados que muitas vezes podem ser dados imperfeitos e com pouca utilidade. No pior dos casos, custos com manutenção e gerenciamento podem ocorrer.

Conclusão

Redes sociais como instagram, facebook e tiktok usam ciência de dados para trazer o conteúdo que o usuário tende a visualizar. Quando encontramos vídeos no youtube sobre assunto que estamos interessados não é mera coincidência, é apenas um algoritmo que se baseou nas nossas visualizações passadas. Isso é ciência de dados.

Projetos práticos

Criando um jogo de pacman usando javascript e pixi.js (parte 1)

Desenvolvimento dos conceitos mais básicos do clássico pacman, como: mapa, animação, deslocamento e detector de colisões.

Criando artes de texto usando imagens

Convertendo imagens para ascii art usando o valor da intensidade das cores cinzentas.

Implementando um algoritmo de pathfinding

Implementando um programa que encontra a menor distância entre dois pontos dentro de um labirinto usando o algoritmo A* (a-estrela).

Criando um sistema de integração contínua (CI/CD)

Fazendo a integração contínua de Jenkins, Sonatype Nexus, Sonatype, JUnit e Gradle para automatizar processos repetitivos. Prática bastante usada em tecnologias de DevOps.

Desenvolvendo um jogo de quebra blocos em javascript

Programando um jogo clássico de arcade usando javascript e p5.js. O usuário deve quebrar os blocos utilizando uma bola ao mesmo tempo que evita que a bola saia pela parte inferior da tela

Veja também

Um algoritmo não pode ser composto por instruções ambíguas, isso pode trazer resultados inesperados

Os algoritmos na ciência da computação são o principal meio para o desenvolvedor poder escrever instruções para o computador, operando a sua maneira

Nunca se sabe quando tem alguém nos espionando no nosso computador

Um computador conectado à internet está exposto a diversos perigos. O spyware é um deles e é esse malware responsável por roubar contas de redes sociais.

Framebuffer

Conjunto de dados armazenados temporariamente na placa de vídeo em forma de matriz. Esses dados serão usados para exibir os frames na tela do monitor.

FPU Unidade de ponto flutuante

Faz cálculos aritméticos com números fracionários usando notação científica, economizando mais bits. Também chamado de vírgula flutuante.

DoS e DDoS

Os ataques DoS e DDoS tem como objetivo tornar indisponível um serviço, seja por razões políticas ou descontentamento em relação à esse serviço.

SWOT Strength Weakness Opportunity Threat

A análise SWOT é um método estratégico de fácil utilidade usado para avaliar desde uma simples pessoa até uma grande empresa.