Em nosso mundo do dedo veloz, tomar e manter a atenção do público é mais reptante do que nunca. É cá que brilham as visualizações animadas. Eles podem:
- Transmita tendências complexas ao longo do tempo em um formato de fácil digestão
- Envolva os espectadores emocionalmente, tornando os dados mais memoráveis
- Incentive a exploração e invenção em conjuntos de dados
- Simplifique a notícia dos principais insights para públicos não técnicos
Porquê profissionais de dados, é crucial estarmos atualizados sobre essas poderosas ferramentas de racontar histórias. Vamos submergir em porquê podemos aproveitá-los de forma eficiente.
Porquê um ávido entusiasta do críquete, eu sabia que queria fazer um tanto relacionado ao Primeira Liga Indiana (IPL). Mas eu não queria produzir unicamente mais uma visualização geral. Não, eu queria um tanto que fizesse até o fã de críquete mais casual sentar e prestar atenção.
Foi quando me dei conta: e se eu pudesse mostrar o número de vitórias de cada equipe IPL ao longo do tempo? Seria porquê ver toda a história do IPL desenrolar-se diante dos seus olhos!
Uma rápida pesquisa no Kaggle me levou a uma mina de ouro – um conjunto de dados IPL abrangente contendo resultados de partidas de 2008 a 2024. Eu baixei mais rápido que o yorker de Jasprit Bumrah e salvei porquê ipl_matches_2008-2024.csv
.
Agora armado com meu conjunto de dados, enfrentei a questão assustadora: porquê posso transformar isso em um daqueles gráficos animados sofisticados?
Embora eu esteja confortável com a codificação de visualizações do zero usando Python, fiquei intrigado com a eficiência potencial das ferramentas de inferior código. Digitar Florescer – uma instrumento que descobri que prometia ajudar a produzir visualizações impressionantes sem codificação – que legítimo é isso!
A gama de opções de visualizações fornecidas pelo Flourish é grande (mesmo para uso no nível gratuito). Ao selecionar a opção “Corrida do gráfico de barras”, seguido de clicar no botão de alternância “Dados”, consegui entender rapidamente os requisitos de dados para o Flourish gerar uma visualização da corrida no gráfico de barras para nós.
É evidente que o conjunto de dados IPL bruto não estava nem perto desse formato, o que significa que tive a oportunidade de aproveitar o poder do GitHub Copilot para massagear os dados e trazê-los para o formato necessário.
Cá está a sequência de interações que tive com o GitHub Copilot para me ajudar a transmudar os dados brutos do IPL no formato desejado (com várias nuances interessantes relacionadas ao IPL):
Porquê primeiro passo, expliquei amplamente o formato em que o conjunto de dados estava originalmente e porquê queria a representação final:
Cá está o resultado retornado pelo GitHub Copilot:
Fiquei agradavelmente surpreso ao desvendar que esse trecho de código era quase correto na primeira tentativa! O processo mostrado é simples:
Depois de extrair as datas exclusivas de cada partida e as equipes exclusivas, inicialize um quadro de dados com as equipes porquê linhas e as datas porquê colunas. Agora, percorra cada data e faça o seguinte:
- Filtrar correspondências até a data atual
- Calcule as vitórias cumulativas de cada equipe
- Atualize o DataFrame com as vitórias cumulativas
O único problema cá foi esse pedaço extra de código – removê-lo funcionou para mim:
Sua visita nos ajuda a continuar oferecendo o melhor para você! sl rl sm bp sn bb bk"># Ensure cumulative sum
if date != unique_dates[0]:
cumulative_wins.at[team, date] += cumulative_wins.at[team, unique_dates[unique_dates.index(date) - 1]]
cumulative_wins.head()
resultou no seguinte:
Mas espere, tem mais! O IPL, porquê qualquer bom drama, tem suas próprias reviravoltas…
Embora esses dados, por si só, sejam suficiente para ser visualizado no Flourish porquê uma corrida de gráfico de barras, decidi abordar algumas das nuances do IPL que darão à visualização uma sensação mais realista.
Renomeação de equipe
Ao longo da história do IPL, houve várias ocasiões em que os proprietários das franquias mudaram, levando à mudança de marca das equipes Lembre-se de quando Carregadores Deccan transformado em Nascer do sol em Hyderabad?
No conjunto de dados, estas são consideradas equipes separadas em linhas separadas, onde em seguida a renomeação, a equipe antiga continua com o número amontoado de vitórias até aquele ano, enquanto a novidade equipe começa novamente com 0 vitórias.
Para mudar isso, tentei os seguintes prompts:
Com algumas pequenas correções, o código resultante ficou assim:
Agora, para generalizar isso e aplicá-lo às várias mudanças, tentei transmudar isso em uma função e usei o Bing para desvendar os anos dessas principais mudanças na equipe, antes de impor a função a elas:
Incrível! Consegui contabilizar todas as mudanças de franquia que aconteceram ao longo dos anos. Mesmo assim, uma coisa me incomodou…
Equipes extintas
Várias equipes do IPL apareceram em unicamente algumas edições e depois desapareceram. Sua presença na visualização final em seguida sua extinção parecia desnecessária.
Portanto, tentei removê-los em seguida sua aparição final usando o seguinte prompt:
Isso me deu outra função interessante, que pude impor às equipes que foram extintas ao longo dos anos (novamente, encontrei esses dados no Bing).
Logotipos de equipes
Nos dados de prova do Flourish, observei que uma pilar continha links para imagens que poderiam ser usadas para cada barra na corrida do gráfico de barras.
Para fazer minha visualização se ressaltar, eu queria fazer um tanto semelhante. Portanto, encontrei as imagens dos logotipos de cada uma das equipes exclusivas em nosso conjunto de dados e as adicionei a uma novidade pilar:
Sua visita nos ajuda a continuar oferecendo o melhor para você! ob oc od gn bk">Levante pequeno toque melhora significativamente a capacidade do testemunha de seguir as equipes ao longo da animação
E agora estava tudo pronto para produzir a visualização!
Com nossos dados preparados e polidos, chegou a hora do evento principal!
Fazer upload para o Flourish foi muito fácil – ele foi capaz de identificar maquinalmente o Rótulo, Valores & Imagem colunas corretamente.
Mudando para o Visualização intervalar, eu tinha um tanto que quase se parecia com o que eu havia imaginado – algumas mudanças de formato cá e ali, e terminamos.
A seguir estão as alterações que fiz:
- Usado “Etiquetas nas barras (imagens no eixo)”porquê o“Modo de rótulos” sob Etiquetas para um visual elegante
- Definir imagem dimensionamento para “Ajustar” e forma para “Retângulo“para logotipos nítidos
- Reduziu o Tamanho % do Contador de tempo atual & Totalizador sob Contador e Totalizador para estabilidade
Sua visita nos ajuda a continuar oferecendo o melhor para você! oc od gn bk">E aí está – de um simples registo CSV a uma visualização dinâmica e envolvente que conta a história do desempenho da equipe IPL ao longo dos anos – com unicamente uma pitada de originalidade e uma pitada de magia de dados. 🎉
Cá está o resultado final👇🏼
Levante projeto simples, mas envolvente, contém vários insights valiosos para cientistas e analistas de dados que buscam aprimorar seu kit de ferramentas para racontar histórias:
- Reles código não significa baixa qualidade: Ferramentas porquê o Flourish podem produzir visualizações sofisticadas que rivalizam com soluções com código personalizado.
- A preparação de dados continua sátira: Nossas habilidades em ciência de dados são inestimáveis na preparação e estruturação de dados para uma visualização eficiente.
- Ganhos de eficiência: Para determinados projetos, as ferramentas de inferior código podem reduzir significativamente o tempo de obtenção de insights sem sacrificar a qualidade.
- Acessibilidade: Essas ferramentas podem ajudar a preencher a vazio entre as equipes de dados e as partes interessadas não técnicas, facilitando uma melhor notícia de insights.
Tags:
Crédito: Natividade Original