Visualização de dados com gráficos de pizza no Matplotli…

Visualização de dados com gráficos de pizza no Matplotli...

Exemplos de porquê produzir diferentes tipos de gráficos de pizza usando Matplotlib para visualizar os resultados da estudo de banco de dados em um Jupyter Notebook com Pandas

Rumo à ciência de dados
Sua visita nos ajuda a continuar oferecendo o melhor para você! 4dppx) and (max-width: 700px) 50vw, (-webkit-min-device-pixel-ratio: 4) and (max-width: 700px) 50vw, (min-resolution: 3dppx) and (max-width: 700px) 67vw, (-webkit-min-device-pixel-ratio: 3) and (max-width: 700px) 65vw, (min-resolution: 2.5dppx) and (max-width: 700px) 80vw, (-webkit-min-device-pixel-ratio: 2.5) and (max-width: 700px) 80vw, (min-resolution: 2dppx) and (max-width: 700px) 100vw, (-webkit-min-device-pixel-ratio: 2) and (max-width: 700px) 100vw, 700px"/>
Foto de Niko Nieminen sobre Remover respingo

Enquanto trabalhava em minha tese de mestrado intitulada “Fatores associados a publicações científicas impactantes na pesquisa de doenças cardíacas financiadas pelo NIH”, usei diferentes tipos de gráficos de pizza para ilustrar algumas das principais descobertas da estudo do banco de dados.

Sua visita nos ajuda a continuar oferecendo o melhor para você! gu oz b hs pt pb pc hv pu pe pf pg pv pi pj pk pw pm pn po px pq pr ps gn bk">Um gráfico de pizza pode ser uma escolha eficiente para visualização de dados quando um conjunto de dados contém um número restringido de categorias que representam partes de um todo, tornando-o adequado para exibir dados categóricos com ênfase na confrontação das proporções relativas de cada categoria.

Neste cláusula, demonstrarei porquê produzir quatro tipos diferentes de gráficos de pizza usando o mesmo conjunto de dados para fornecer uma representação visual mais abrangente e uma visão mais profunda dos dados. Para conseguir isso, usarei Matplotlib, a livraria de plotagem do Python, para exibir visualizações de gráficos de pizza dos dados estatísticos armazenados no dataframe. Se você não está familiarizado com a livraria Matplotlib, um bom primórdio é Python Data Science Handbook de Jake VanderPlas, especificamente o capítulo sobre Visualização com Matplotlib e matplotlib.org.

Primeiro, vamos importar todas as bibliotecas e extensões necessárias:

A seguir, prepararemos o registo CSV para processamento:

O miniconjunto de dados usado neste cláusula destaca os 10 principais periódicos com publicações de pesquisas sobre doenças cardíacas de 2002 a 2020 e faz secção de um banco de dados maior coletado para a pesquisa da tese de mestrado. As colunas “Feminino”, “Masculino” e “Ignoto” representam o sexo do primeiro responsável dos artigos publicados, enquanto a pilar “Totalidade” reflete o número totalidade de artigos de pesquisa sobre doenças cardíacas publicados em cada periódico.

Imagem do responsável e representa a saída do código de exemplo Pie_Chart_Artcile_2.py supra.

Para conjuntos de dados menores com menos categorias, um gráfico de pizza com fatias explosivas pode efetivamente realçar uma categoria principal, destacando-a ligeiramente do resto do gráfico. Esse efeito visual labareda a atenção para categorias específicas, destacando-as do todo. Cada fatia representa uma secção do totalidade, com tamanho proporcional aos dados que representa. Podem ser adicionados rótulos a cada fatia para indicar a categoria, juntamente com porcentagens para mostrar sua proporção em relação ao totalidade. Essa técnica visual destaca a fatia explodida sem perder o contexto da representação completa dos dados.

Imagem do responsável e representa a saída do código de exemplo Pie_Chart_Artcile_3.py supra.

A mesma técnica de explosão de fatias pode ser aplicada a todas as outras entradas no conjunto de dados de modelo, e os gráficos resultantes podem ser exibidos em uma única figura. Levante tipo de visualização ajuda a realçar a representação excessiva ou insuficiente de uma categoria específica no conjunto de dados. No exemplo fornecido, a apresentação de todos os 10 gráficos numa única figura revela que nenhuma das 10 principais revistas especializadas em investigação sobre doenças cardíacas publicou mais artigos de autoria de mulheres do que de homens, enfatizando assim a disparidade de género.

Distribuições de gênero para os 10 principais periódicos de publicações de pesquisas sobre doenças cardíacas, 2002–2020. Imagem do responsável e representa a saída do código de exemplo Pie_Chart_Artcile_4.py supra.

Uma variação do gráfico de pizza, conhecida porquê gráfico de rosca, também pode ser usada para visualizar dados. Os gráficos de rosca, assim porquê os gráficos de pizza, exibem as proporções das categorias que compõem um todo, mas o meio do gráfico de rosca também pode ser utilizado para apresentar dados adicionais. Esse formato é menos confuso visualmente e pode facilitar a confrontação dos tamanhos relativos das fatias em confrontação com um gráfico de pizza padrão. No exemplo usado neste cláusula, o gráfico de rosca destaca que entre os 10 principais periódicos com publicações de pesquisas sobre doenças cardíacas, o American Journal of Physiology, Heart and Circulatory Physiology publicou o maior número de artigos, respondendo por 21,8%.

Imagem do responsável e representa a saída do código de exemplo Pie_Chart_Artcile_5.py supra.

Podemos aprimorar a visualização de informações adicionais do conjunto de dados de modelo com base no gráfico de rosca anterior e criando uma versão aninhada. O add_artista() O método do módulo figure do Matplotlib é usado para incorporar qualquer Artista suplementar (porquê figuras ou objetos) na figura base. Semelhante ao gráfico de rosca anterior, esta variação mostra a distribuição de publicações nas 10 principais revistas de pesquisa sobre doenças cardíacas. No entanto, também inclui uma classe suplementar que mostra a distribuição por gênero dos primeiros autores de cada periódico. Esta visualização destaca que uma porcentagem maior dos primeiros autores são do sexo masculino.

Imagem do responsável e representa a saída do código de exemplo Pie_Chart_Artcile_6.py supra.

Concluindo, os gráficos de pizza são eficazes para visualizar dados com um número restringido de categorias, pois permitem que os visualizadores compreendam rapidamente as categorias mais importantes ou proporções dominantes. Neste exemplo Sua visita nos ajuda a continuar oferecendo o melhor para você! a utilização de quatro tipos diferentes de gráficos circulares fornece uma visualização clara da distribuição de género entre os primeiros autores nas 10 principais revistas de publicações de investigação sobre doenças cardíacas, com base no miniconjunto de dados de 2002 a 2020 utilizado neste estudo. É evidente que uma percentagem mais elevada dos primeiros autores da publicação são homens, e nenhuma das 10 principais revistas de investigação sobre doenças cardíacas publicou mais artigos de autoria de mulheres do que de homens durante o período sondado.

O Jupyter Notebook e o conjunto de dados usados ​​para nascente cláusula podem ser encontrados em GitHub

Obrigado por ler,

Diana

Reparo: usei incorporações do GitHub para publicar nascente cláusula.

Tags:

Crédito: Manancial Original

Adriano Pina

Adriano Pina

Análise de Sistemas | SEO e Google Ads | Fundador da Loja Script PHP Aqui & Marca Shoslh de tecnologia

Especialista em transformar ideias em soluções digitais e acelerar o crescimento online.

Deixe um comentário

Tem perguntas? Nos envia sua mensagem 24/7!

(17) 99100-0874

Endereço & Contato

Centro, Interior de São Paulo
E-mail: [email protected]

Links Úteis
BAIXAR APP | SCRIPT PHP AQUI
Certificados
0
    0
    Seu carrinho
    Seu carrinho está vazio

    Usamos cookies para garantir que oferecemos a melhor experiência em nosso site. 

       

    X

    Clique em um de nossos representantes abaixo para conversar no WhatsApp ou envie um email para: 📧 [email protected]

    Precisa de ajuda fale conosco?