Cientista de Dados Sênior
Sumário do Cargo:
Responsável por coletar, analisar e interpretar grandes conjuntos de dados buscando soluções para os problemas
de negócios. Contribuir na tomada de decisões por meio de análises exploratórias, construção de modelos
preditivos, prescritivos e de otimização. Contribuir ativamente para desenho de coleta e análise de dados e que
permitam uso de técnicas avançadas de inteligência artificial.
Descrição de Cargo / Responsabilidades:
Tratar, transformar e organizar dados (estruturados, semi-estruturados ou não-estruturados), com uso de habilidades em matemática, estatística, programação, machine learning e outros, aplicando suas capacidades analíticas, de conhecimento de negócio, de compreensão contextual, para identificar soluções
para os problemas de negócios e contribuir na tomada de decisões e estratégias da instituição;
● Explorar e analisar dados de uma variedade de ângulos para determinar fraquezas escondidas, tendências
e / ou oportunidades para gerar valor ao negócio e a sociedade;
● Conceber soluções orientadas a dados para os desafios mais prementes da instituição e da sociedade;
● Desenvolver novos algoritmos e/ou adaptar algoritmos do estado da arte para resolver problemas e criar
novas ferramentas para automatizar o trabalho;
● Comunicar de maneira clara previsões e resultados para as áreas demandantes, através de visualizações
de dados eficazes e storytelling, adotando gráficos, tabelas, relatórios e, principalmente, narrativas para apresentar conclusões de um projeto de análise de dados para um público não técnico;
● Recomendar mudanças nos procedimentos e estratégias da Instituição decorrentes de informações
geradas durante a análise de dados;
● Utilizar os dados de forma ética e de acordo com as políticas de segurança da informação da instituição e
da lei geral de proteção de dados;
● Atuar como referencia técnica de seu grupo de trabalho, direcionando e acompanhando as atividades;
● Atuar de forma humanizada na relação com o paciente, familiar e cliente interno, conforme Filosofia
Planetree e diretrizes de qualidade e segurança do paciente;
● Conhecer os riscos dos locais de trabalho, cumprir e fazer cumprir os procedimentos, disposições legais,
normas, instruções e políticas de Saúde, Segurança e Meio Ambiente.
Responsabilidades específicas da área de atuação:
- Gestão dos dados (tratar, transformar, organizar dados).
- Desenvolver novos algoritmos e/ou adaptar algoritmos do estado da arte para resolver problemas e criar
ferramentas para automatizar o trabalho.
- Se manter atualizado com artigos e publicações recentes em áreas similares a do projeto.
- Recomendar mudanças nos procedimentos e estratégias do projeto decorrentes de informações
geradas durante a análise de dados.
- Comunicar de maneira clara previsões e resultados para as áreas demandantes, através de
visualizações de dados eficazes e storytelling, adotando gráficos, tabelas, relatórios e, principalmente,
narrativas para apresentar conclusões de um projeto de análise de dados para um público não técnico;
- Utilizar os dados de forma ética e de acordo com as políticas de segurança da informação da instituição
e da lei geral de proteção de dados (LGPD).
- Realizar experimentos para testar modelo definido.
Requisitos Técnicos:
Cálculo multivariável e álgebra linear;
● Estatística descritiva, inferencial e escolas de probabilidade (tais como: frequentista e bayesiana);
● Data wrangling: limpeza e manipulação de dados, extrair informações de arquivos, expressões regulares,
transformações matemáticas e domínio de queries em banco de dados relacionais;
● Programação em linguagens de Data Science (tais como: R, Python, SQL e Matlab). Conhecimentos de
pacotes como: Tensorflow, Keras, Pytorch, Numpy, Pandas, Sklearn, Tidyverse, Caret, Data.table, Shiny,
Forecast entre outros;
● Métodos de análise avançada utilizando ferramentas de inteligência artificial: machine learning
(aprendizagem supervisionada e não supervisionada);
● Comunicação, visualização de dados e data storytelling;
● Pensamento analítico avançado: maturidade no desenvolvimento de modelos preditivos de dados. Fazer
as perguntas certas, reconhecer o que é ou não importante, saber quais métodos analíticos devem ser utilizados;
Desejável:
● nível de inglês avançado;
● Graduação completa;
● Outros métodos de machine learning: reinforcement learning (tais como: Q-learning, TD-learning), deep
learning (tais como: redes neurais, CNN, RNN e GAN);
● Conhecimento de algoritmos de otimização e utilização de softwares (tais como Gurobi, Simplex, newton-
rapson e olm) e elementos de computação evolutiva;
● Outras ferramentas: debugging, testing, controle de versão (Git) e model deployment;
● Conhecimento do funcionamento de bancos de dados relacionais. (Tais como: MS SQL Server, Oracle,
MySQL e PostgreSQL);
● Conhecimento do funcionamento de bancos de dados NoSQL. (Tais como: Cassandra, MongoDB,
CouchDB, Giraffe e Hbase);
● Conhecimento do ecossistema Hadoop (tais como: HDFS, Spark, Hive, Impala, Flume, Sqoop, Zookeeper,
Oozie, Hue, Kafka, Storm, Scala e Python);
● Conhecimento de conceitos de gestão de projetos (metodologia ágil, scrum, PMBOK, entre outros).
Soft Skils
● Comunicação (oral e escrita) assertiva;
● Capacidade de trabalhar em equipe, bom relacionamento interpessoal e comprometido com as metas e
valores da instituição;
● Visão sistêmica;
● Resiliência frente a problemas cotidianos;
● Capacidades analítica e investigativa e meticulosidade;
● Autodesenvolvimento;
● Capacidade e iniciativa para tomada de decisões – Proatividade;
● Capacidade de incentivar, educar e dar feedback;
● Liderança.
Local: Hibrido (2 vezes no escritório - Morumbi)