際際滷

際際滷Share a Scribd company logo
Teste Analista de Dados - Nadiveth Duno.pdf
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 1
2022
TEXTO PARA DISCUSSO
ANALISTA DE DADOS
HOSPITAL ISRAELITA ALBERT EINSTEIN
EM PARCERIA COM TOTI
Nadiveth Duno | Ci棚ncias de Dados | Maio 2022
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 2
TESTE ANALISTA DE DADOS
1. Os dados
A presente publica巽達o corresponde aos resultados dos dados da pandemia CODVID19,
do ano 2020, nos meses setembro, outubro e novembro, do Instituto Brasileiro de
Geografia e Estat鱈stica  IBGE.
Deste estudo, se seleccionarom os dados para poder modelar e criar uma banco de dados
robusto em SQL, baseada nos fundamentos principais e normaliza巽探es das bases de
dados, para assim produzir consultas nos dados e agrupar informa巽達o que permitam
tomar deci巽探es assertivas de forma eficiente e simples, para assim construir pol鱈ticas e
processos internos que possam melhorar cada dia.
E o melhor: depois da toma de decis探es, o hospital possa continuar sendo refer棚ncia na
comunidade brasileira, apesar das colis探es pand棚micas.
Os dados do estudo do IBGE permanecem publicos e disponives em seu portal web, no
endereco: https://www.ibge.gov.br/estatisticas/sociais/saude/27947-divulgacao-mensal-
pnadcovid2.html?edicao=28351&t=downloads.
Para acessar e fazer download dos arquivos seguimos a rota:
Downloads > Microdados > Dados
Para melhor compensa巽達o 辿 recomendado seguir a sequ棚ncia de passos, que aqui se
exibem:
Passo 1: Clica em Downloads
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 3
Passo 2: Clica em Microdados
Passo 3: Clica em Dados
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 4
Passo 4: Seleciona os arquivos de sua prefer棚ncia.
Os arquivos descarregados devem ser acompanhados da documenta巽達o dispon鱈vel na
mesma sess達o dos microdados, para seu futuro entendimento e estudo
E a documenta巽達o, nos dicion叩rios na sess達o Downloads > Microdados > Documentacao
Para acessar seguimos a rota:
Downloads > Microdados > Dados
Para melhor compensa巽達o 辿 recomendado seguir a sequ棚ncia de passos:
Passo 1: Clica em Downloads
Para este analises de dados, foram
selecionados os arquivos:
PNAD_COVID_092020.zip
PNAD_COVID_092020.zip
PNAD_COVID_092020.zip
Que correspondem aos meses setembro,
outubro e novembro respetivamente.
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 5
Passo 2: Clica em Microdados
Passo 3: Clica em Documentacao
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 6
Passo 4: Seleciona os arquivos de sua prefer棚ncia.
Em resultado, dos arquivos descarregados, obtivemos:
3 arquivos comprimidos, de extens達o *.zip
3 arquivos de extens達o *.xls
Dicion叩rios que correspondem aos meses selecionados
no apartado anterior:
Dicionario_PNAD_COVID_092020_20220418.xls
Dicionario_PNAD_COVID_102020_20220418.xls
Dicionario_PNAD_COVID_112020_20220418.xls
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 7
Os de extens達o *.zip, foram descomprimidos, para obtiver 3 arquivos de extens達o *.csv
Com ditos arquivos, arranjamos a informa巽達o para iniciar nosso modelamento de dados,
quest達o que se ilustrara na pr坦xima sess達o (Modelagem dos dados).
2. Modelagem dos dados
Para modelar os dados, devemos estudar os arquivos descarregados do site do IBGE,
faremos a simula巽達o com um o banco de dados SQLite, para assim obter reportes que
possam permitir a toma de decis探es acertadas no Hospital HIAE.
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 8
Em seguida faremos uma explica巽達o de como foi simular os dados.
A qual foi feita com a linguagem de programa巽達o SQL, em SQLite vers達o
v3.30, no site do fiddle, dispon鱈vel gratuitamente em https://www.db-
fiddle.com/
2.1. Cria巽達o da base de dados
Para cria a base de dados, usaremos o dicion叩rio das vari叩veis do IBGE, da pandemia
COVID descarregado na sess達o anterior.
Fonte: IBGE dispon鱈vel em https://www.ibge.gov.br/estatisticas/sociais/saude/27947-divulgacao-mensal-
pnadcovid2.html?edicao=28351&t=downloads.
2.1.1. Estrutura da tabela
Uma tabela no SQL tem a seguinte estrutura:
Nome da tabela a chave primaria e a descri巽達o ficaram descritas desta forma:
a) Nome da tabela
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 9
Os nomes das tabelas correspondem  descri巽達o do quesito:
b) Nome da vari叩vel
O nome da vari叩vel para cada tabela corresponde ao c坦digo da vari叩vel:
c) Nome da descri巽達o
O nome da descri巽達o para cada tabela corresponde a uma frase generalizada que vai
conter a descri巽達o do quesito em cada categoria:
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 10
2.1.2. Entidade relacionamento das tabelas
A continua巽達o se presenta a entidade rela巽達o que preservo a normaliza巽達o deste banco de
dados.
2.2. Inser巽達o na Base de Dados
Os dados insertados correspondem ao dicion叩rio do IBGE para o estudo da pandemia
COVID19, para o ano 2020, ditos quesitos correspondem a vari叩vel e descri巽達o das
tabelas que aquiescem a base de dados.
A continua巽達o se apresentam as inser巽探es seguindo a seguinte estrutura do SQL
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 11
Onde o primeiro valor representa ao tipo da categoria e o segundo  descri巽達o da
categoria por quesito.
a) ID da tabela
O ID da tabela corresponde ao tipo da categoria:
b) Descri巽達o da tabela
A descri巽達o para cada tabela corresponde  descri巽達o do quesito em cada categoria:
A modelagem dos dados completo est達o dispon鱈veis em:
https://www.db-fiddle.com/f/fW5Pfed3yD7ufuFNN3fo5q/27
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 12
2.3. Consultas na Base de Dados - Query
O mapeamento e manipula巽達o dos dados, foram usados os campos da tabela principal
PNAD_COVID_092020 implementando algumas fun巽探es de agrega巽達o o qual
permitiram a otimiza巽達o das consultas ou query.
De maneira resumida temos as seguintes consultas:
a) Consulta na tabela unidade da Federa巽ao
b) Consulta na tabela regi達o metropolitana e regi達o administrativa integrada de
desenvolvimento
c) Consulta na tabela PNAD_COVID_092020 com dados modelados
Nadiveth Duno | @nadiduno.csv  TOTI Inclus達o e inova巽達o
PGINA 13
d) Consulta na tabela PNAD_COVID_092020 com dados em bruto

More Related Content

More from Nadiveth Duno (11)

Material Did叩ctico de InternetMaterial Did叩ctico de Internet
Material Did叩ctico de Internet
Nadiveth Duno
Photoshop para principiantesPhotoshop para principiantes
Photoshop para principiantes
Nadiveth Duno
Material Did叩ctico de BlogMaterial Did叩ctico de Blog
Material Did叩ctico de Blog
Nadiveth Duno
Material Did叩ctico de WindowsMaterial Did叩ctico de Windows
Material Did叩ctico de Windows
Nadiveth Duno
Practica 3 de photoshopPractica 3 de photoshop
Practica 3 de photoshop
Nadiveth Duno
Practica 2 de photoshopPractica 2 de photoshop
Practica 2 de photoshop
Nadiveth Duno
Practica 1 de photoshopPractica 1 de photoshop
Practica 1 de photoshop
Nadiveth Duno
Photoshop  e ciudadanosPhotoshop  e ciudadanos
Photoshop e ciudadanos
Nadiveth Duno
RSSRSS
RSS
Nadiveth Duno
Redes SocialesRedes Sociales
Redes Sociales
Nadiveth Duno
Aspectos PedagogicosAspectos Pedagogicos
Aspectos Pedagogicos
Nadiveth Duno
Material Did叩ctico de InternetMaterial Did叩ctico de Internet
Material Did叩ctico de Internet
Nadiveth Duno
Photoshop para principiantesPhotoshop para principiantes
Photoshop para principiantes
Nadiveth Duno
Material Did叩ctico de BlogMaterial Did叩ctico de Blog
Material Did叩ctico de Blog
Nadiveth Duno
Material Did叩ctico de WindowsMaterial Did叩ctico de Windows
Material Did叩ctico de Windows
Nadiveth Duno
Practica 3 de photoshopPractica 3 de photoshop
Practica 3 de photoshop
Nadiveth Duno
Practica 2 de photoshopPractica 2 de photoshop
Practica 2 de photoshop
Nadiveth Duno
Practica 1 de photoshopPractica 1 de photoshop
Practica 1 de photoshop
Nadiveth Duno
Photoshop  e ciudadanosPhotoshop  e ciudadanos
Photoshop e ciudadanos
Nadiveth Duno
Redes SocialesRedes Sociales
Redes Sociales
Nadiveth Duno
Aspectos PedagogicosAspectos Pedagogicos
Aspectos Pedagogicos
Nadiveth Duno

Teste Analista de Dados - Nadiveth Duno.pdf

  • 2. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 1 2022 TEXTO PARA DISCUSSO ANALISTA DE DADOS HOSPITAL ISRAELITA ALBERT EINSTEIN EM PARCERIA COM TOTI Nadiveth Duno | Ci棚ncias de Dados | Maio 2022
  • 3. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 2 TESTE ANALISTA DE DADOS 1. Os dados A presente publica巽達o corresponde aos resultados dos dados da pandemia CODVID19, do ano 2020, nos meses setembro, outubro e novembro, do Instituto Brasileiro de Geografia e Estat鱈stica IBGE. Deste estudo, se seleccionarom os dados para poder modelar e criar uma banco de dados robusto em SQL, baseada nos fundamentos principais e normaliza巽探es das bases de dados, para assim produzir consultas nos dados e agrupar informa巽達o que permitam tomar deci巽探es assertivas de forma eficiente e simples, para assim construir pol鱈ticas e processos internos que possam melhorar cada dia. E o melhor: depois da toma de decis探es, o hospital possa continuar sendo refer棚ncia na comunidade brasileira, apesar das colis探es pand棚micas. Os dados do estudo do IBGE permanecem publicos e disponives em seu portal web, no endereco: https://www.ibge.gov.br/estatisticas/sociais/saude/27947-divulgacao-mensal- pnadcovid2.html?edicao=28351&t=downloads. Para acessar e fazer download dos arquivos seguimos a rota: Downloads > Microdados > Dados Para melhor compensa巽達o 辿 recomendado seguir a sequ棚ncia de passos, que aqui se exibem: Passo 1: Clica em Downloads
  • 4. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 3 Passo 2: Clica em Microdados Passo 3: Clica em Dados
  • 5. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 4 Passo 4: Seleciona os arquivos de sua prefer棚ncia. Os arquivos descarregados devem ser acompanhados da documenta巽達o dispon鱈vel na mesma sess達o dos microdados, para seu futuro entendimento e estudo E a documenta巽達o, nos dicion叩rios na sess達o Downloads > Microdados > Documentacao Para acessar seguimos a rota: Downloads > Microdados > Dados Para melhor compensa巽達o 辿 recomendado seguir a sequ棚ncia de passos: Passo 1: Clica em Downloads Para este analises de dados, foram selecionados os arquivos: PNAD_COVID_092020.zip PNAD_COVID_092020.zip PNAD_COVID_092020.zip Que correspondem aos meses setembro, outubro e novembro respetivamente.
  • 6. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 5 Passo 2: Clica em Microdados Passo 3: Clica em Documentacao
  • 7. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 6 Passo 4: Seleciona os arquivos de sua prefer棚ncia. Em resultado, dos arquivos descarregados, obtivemos: 3 arquivos comprimidos, de extens達o *.zip 3 arquivos de extens達o *.xls Dicion叩rios que correspondem aos meses selecionados no apartado anterior: Dicionario_PNAD_COVID_092020_20220418.xls Dicionario_PNAD_COVID_102020_20220418.xls Dicionario_PNAD_COVID_112020_20220418.xls
  • 8. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 7 Os de extens達o *.zip, foram descomprimidos, para obtiver 3 arquivos de extens達o *.csv Com ditos arquivos, arranjamos a informa巽達o para iniciar nosso modelamento de dados, quest達o que se ilustrara na pr坦xima sess達o (Modelagem dos dados). 2. Modelagem dos dados Para modelar os dados, devemos estudar os arquivos descarregados do site do IBGE, faremos a simula巽達o com um o banco de dados SQLite, para assim obter reportes que possam permitir a toma de decis探es acertadas no Hospital HIAE.
  • 9. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 8 Em seguida faremos uma explica巽達o de como foi simular os dados. A qual foi feita com a linguagem de programa巽達o SQL, em SQLite vers達o v3.30, no site do fiddle, dispon鱈vel gratuitamente em https://www.db- fiddle.com/ 2.1. Cria巽達o da base de dados Para cria a base de dados, usaremos o dicion叩rio das vari叩veis do IBGE, da pandemia COVID descarregado na sess達o anterior. Fonte: IBGE dispon鱈vel em https://www.ibge.gov.br/estatisticas/sociais/saude/27947-divulgacao-mensal- pnadcovid2.html?edicao=28351&t=downloads. 2.1.1. Estrutura da tabela Uma tabela no SQL tem a seguinte estrutura: Nome da tabela a chave primaria e a descri巽達o ficaram descritas desta forma: a) Nome da tabela
  • 10. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 9 Os nomes das tabelas correspondem descri巽達o do quesito: b) Nome da vari叩vel O nome da vari叩vel para cada tabela corresponde ao c坦digo da vari叩vel: c) Nome da descri巽達o O nome da descri巽達o para cada tabela corresponde a uma frase generalizada que vai conter a descri巽達o do quesito em cada categoria:
  • 11. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 10 2.1.2. Entidade relacionamento das tabelas A continua巽達o se presenta a entidade rela巽達o que preservo a normaliza巽達o deste banco de dados. 2.2. Inser巽達o na Base de Dados Os dados insertados correspondem ao dicion叩rio do IBGE para o estudo da pandemia COVID19, para o ano 2020, ditos quesitos correspondem a vari叩vel e descri巽達o das tabelas que aquiescem a base de dados. A continua巽達o se apresentam as inser巽探es seguindo a seguinte estrutura do SQL
  • 12. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 11 Onde o primeiro valor representa ao tipo da categoria e o segundo descri巽達o da categoria por quesito. a) ID da tabela O ID da tabela corresponde ao tipo da categoria: b) Descri巽達o da tabela A descri巽達o para cada tabela corresponde descri巽達o do quesito em cada categoria: A modelagem dos dados completo est達o dispon鱈veis em: https://www.db-fiddle.com/f/fW5Pfed3yD7ufuFNN3fo5q/27
  • 13. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 12 2.3. Consultas na Base de Dados - Query O mapeamento e manipula巽達o dos dados, foram usados os campos da tabela principal PNAD_COVID_092020 implementando algumas fun巽探es de agrega巽達o o qual permitiram a otimiza巽達o das consultas ou query. De maneira resumida temos as seguintes consultas: a) Consulta na tabela unidade da Federa巽ao b) Consulta na tabela regi達o metropolitana e regi達o administrativa integrada de desenvolvimento c) Consulta na tabela PNAD_COVID_092020 com dados modelados
  • 14. Nadiveth Duno | @nadiduno.csv TOTI Inclus達o e inova巽達o PGINA 13 d) Consulta na tabela PNAD_COVID_092020 com dados em bruto