
WaveAccess
Middle Data Scientist (LLM) / Специалист по данным
- Python
- SQL
- Transformers
- LLM
- Standard NLP stack
- Standard ML stack
- Git
- Vector databases(Postgres+pgvector / Milvus/ Qdrant/ Faiss)
- Английский — B2 — Средне-продвинутый
WaveAccess is looking for a Data Scientist to join our team and contribute to innovative projects in the pharmaceutical domain. This role involves working with real-world pharmaceutical data and leveraging the power of Large Language Models (LLMs) to drive impactful insights and solutions.
Responsibilities:
- LLM Integration: Develop, fine-tune, and implement Large Language Models to analyze and process diverse sets of text and medical data
- Data Analysis: Perform advanced data analysis on real-world pharmaceutical datasets to extract meaningful insights and support decision-making processes
- Text Mining and NLP: Utilize natural language processing techniques to extract relevant information from large volumes of text, including medical literature, patient records, and clinical trial data
- Model Development: Build and validate predictive models to address key challenges in the pharmaceutical industry, such as drug efficacy, patient outcomes, and adverse event prediction
- Innovation: Stay up-to-date with the latest advancements in LLMs and NLP, and apply innovative approaches to solve complex problems in the pharmaceutical field
Requirements:
- At least 3 years of experience in a Data Scientist position
- English - B2
- Deep knowledge of Neural Networks and architectures for working with sequences, in particular (RNN, LSTM, Transformers, CNN, attention)
- Experience with Large Language Models (LLMs) and their application. Familiarity with modern LLM techniques such as Retrieval-Augmented Generation (RAG) and LLM agents
- Solid Python skills
- Experience in presenting achieved results
Technologies:
- Python
- Transformers
- LLM
- Standard NLP stack
- Standard ML stack
- Basic SQL
- Git
- Vector databases(Postgres+pgvector / Milvus/ Qdrant/ Faiss)
Preferred:
- Knowledge of general Machine Learning approaches
- Knowledge of mathematical statistics
- Experience with AWS (EC2, S3)
- Linux + bash, ssh
- Experience in written and verbal communication with business stakeholders
- Experience with full development cycle
Nice to have:
- RestAPI development experience
- Snowflake
- Docker
- Understanding of CI/CD
- Java/C++/Other languages
We offer the following conditions:
-
Work in a dynamic international team
- Employment according to labor law, 100% payment for sick leave and vacation
-
Opportunity for cooperation through individual entrepreneurship/self-employment
-
Participation in foreign and Russian projects
-
Health insurance with dental coverage
-
Necessary equipment for work
-
Corporate training programs
-
Broad opportunities for self-realization, professional and career growth
-
Democratic approach to processes and flexible start of the workday.
Вакансия на русском:Компания WaveAccess ищет Data Scientist для работы в нашей команде и участия в инновационных проектах в фармацевтической сфере. В этой роли вы будете работать с реальными фармацевтическими данными и использовать возможности больших языковых моделей (LLM) для получения значимых инсайтов и разработки решений.
Обязанности: -
Интеграция LLM: разработка, тонкая настройка и внедрение больших языковых моделей для анализа и обработки разнообразных текстовых и медицинских данных
-
Анализ данных: проведение продвинутого анализа реальных фармацевтических наборов данных для извлечения полезных инсайтов и поддержки принятия решений
-
Текстовый майнинг и NLP: использование методов обработки естественного языка для извлечения релевантной информации из больших объемов текста, включая медицинскую литературу, записи пациентов и данные клинических испытаний
-
Разработка моделей: создание и валидация предиктивных моделей для решения ключевых задач в фармацевтике, таких как эффективность препаратов, результаты лечения пациентов и прогнозирование побочных эффектов
-
Инновации: отслеживание последних достижений в области LLM и NLP и применение инновационных подходов для решения сложных задач в фармацевтической области
Требования: -
Опыт работы на позиции Data Scientist не менее 3 лет
-
Английский язык — уровень B2
-
Глубокие знания нейронных сетей и архитектур для работы с последовательностями, в частности RNN, LSTM, Transformers, CNN, attention
-
Опыт работы с большими языковыми моделями (LLM) и их применением. Знание современных техник LLM, таких как Retrieval-Augmented Generation (RAG) и LLM-агенты
Технологии: -
Python
-
Transformers
-
LLM
-
Стандартный стек NLP
-
Стандартный стек ML
-
Базовый SQL
-
Git
-
Векторные базы данных (Postgres+pgvector / Milvus / Qdrant / Faiss)
Желательно: -
Знание общих подходов машинного обучения
-
Знания математической статистики
-
Опыт работы с AWS (EC2, S3)
-
Linux + bash, ssh
-
Опыт письменного и устного взаимодействия с бизнес-стейкхолдерами
-
Опыт полного цикла разработки
Будет плюсом: -
Опыт разработки RestAPI
-
Snowflake
-
Docker
-
Понимание CI/CD
-
Знание Java/C++/других языков
Мы предлагаем: -
Работа в динамичной международной команде
-
Официальное трудоустройство по трудовому законодательству, 100% оплата больничных и отпусков
-
Возможность сотрудничества через ИП / самозанятость
-
Участие в зарубежных и российских проектах
-
Медицинская страховка с стоматологией
-
Необходимое оборудование для работы
-
Корпоративные обучающие программы
-
Широкие возможности для самореализации, профессионального и карьерного роста
-
Демократичный подход к процессам и гибкий старт рабочего дня