Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Data scientist — удалённая работа в Москве

Дата: 2025-09-18
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2025-09-18
Описание
Пройти тестирования. Пожелания и особенности: Пройти тестирование по Data Science на 1.5 часа, включающий 66 вопросов, минимум на 70%. Примеры вопросов прикрепляю.
Похожие заказы

Data scientist

дистанционно
договорная
Разработка с нуля. 1. Цель и назначение продукта Разработать Telegram-юзербота для автоматизированного сбора коммерческих условий (стоимость и сроки размещения рекламных постов) у владельцев и администраторов Telegram-каналов. Юзербот выступает в роли агента по закупке рекламы, имитируя поведение живого пользователя для получения максимально полных и достоверных ответов . 2. Термины и определения • Юзербот (Userbot) — скрипт, управляющий действиями от лица обычного аккаунта Telegram, а не бота (с токеном от@BotFather). Это критично для обхода ограничений, так как боты часто не могут инициировать диалоги с незнакомыми пользователями . • Таргет — аккаунт (канал) пользователя Telegram, которому отправляется запрос. • Аккаунт-исполнитель — учетная запись Telegram, через которую юзербот совершает действия. • Варминг (Прогрев) — процесс имитации естественной активности аккаунта для повышения его репутации в системе безопасности Telegram . 3. Требования к аккаунтам-исполнителям Система должна поддерживать работу с несколькими аккаунтами-исполнителями для масштабирования и снижения риска бана. • Ввод аккаунтов: Добавление через api_id, api_hash (получить на my.telegram.org) и номер телефона. Поддержка сессий Pyrogram/Telethon . • Прогрев (Warmup): Обязательное условие перед началом работы. Аккаунт должен быть «прогрет»: o Установлен аватар, имя, био. o Аккаунт должен иметь историю переписки с несколькими контактами (2-3 дня минимальной активности). o Инструмент для автоматического прогрева может быть предоставлен отдельно или реализован в базовом функционале . • Мониторинг статуса: Аккаунт должен периодически проверять свой статус через @SpamBot и сообщать о блокировках . 4. Функциональные требования к боту 4.1. Управление списком таргетов • Загрузка списка: В системе должен быть предусмотрен интерфейс (например, загрузка CSV/TXT файла или ввод через консоль/веб-интерфейс) со списком юзернеймов или ID каналов/пользователей. • Очередь и скорость отправки: Система должна автоматически распределять таргеты по аккаунтам-исполнителям. Главное ограничение: o Интервал между отправкой сообщений от одного аккаунта: от 10 до 30 минут. Это критично для имитации человеческого поведения и предотвращения блокировок . 4.2. Первичный диалог (Скрипт A) При первом контакте с таргетом юзербот должен отправить сообщение с запросом стоимости размещения. Текст должен быть вариативным для обхода антиспам-фильтров. • Условие: Отправить первое сообщение. • Алгоритм вариативности: 1. Сгенерировать текст из пула 50 перефразированных вариантов. 2. После использования всех 50 вариантов, начать их повторение с начала. • Примеры фраз: o «Добрый день! Подскажите, пожалуйста, какова стоимость размещения рекламного поста в вашем канале? И на какой срок обычно размещаете?» o «Приветствую! Интересуюсь прайсом на рекламную публикацию в вашем канале. Какие сроки размещения вы предлагаете?» o «Здравствуйте! Подскажите цену за пост в вашем канале и длительность его нахождения в ленте?» (и так далее, всего 50 вариантов). 4.3. Обработка ответов (Скрипт B — «Неспешное уточнение») После получения ответа от таргета, бот должен переключиться на сценарий уточнения условий. • Режим работы: Медленный, имитирующий живого человека (паузы между сообщениями, человеческая пунктуация). • Задача: Зафиксировать все условия размещения. Бот должен уметь распознавать в ответе пользователя следующие ключевые сущности и сохранять их в базу данных: o Цена: Стоимость размещения (в USD, RUB, TON или др.). Бот должен понимать разные форматы («10 баксов», «1000 рублей», «5 тон»). o Срок: Период размещения поста в канале (например, «навсегда», «на сутки», «на 3 дня», «на неделю»). o Формат поста: Есть ли особые требования к тексту, медиа, кнопкам. o Оплата: Каким способом принимают оплату. • Логика уточнения: Если в ответе не хватает какой-то информации (например, сказали цену, но забыли про срок), бот должен сгенерировать уточняющий вопрос («А на какой срок эта цена?», «Пост висит сутки или навсегда?»). 4.4. Логирование и хранение данных Система должна сохранять: • ID чата/канала. • Временные метки: Время отправки первого сообщения, время ответа таргета. • Скрипт диалога: Полную историю переписки для анализа. • Результат: Извлеченные параметры (цена, срок, валюта, способ оплаты, особые условия) в структурированном виде. • Статус обработки: В очереди, Прогрев, Сообщение отправлено, Ответ получен, Уточнение данных, Готово, Забанен (недоступен) . 5. Нефункциональные требования и безопасность 5.1. Безопасность аккаунтов • Юзербот должен использовать механизмы антидетекта, характерные для библиотек Telethon/Pyrogram . • Запрещены: Спам-бомбинг, слишком частые запросы, работа без прогрева. • Ответственность: Разработчик предупреждает заказчика о рисках блокировки аккаунтов при нарушении режимов работы и предоставляет рекомендации по безопасному использованию . 5.2. Масштабируемость Архитектура должна позволять добавлять неограниченное количество аккаунтов-исполнителей (поддерживать мультиклиентность) . 5.3. Язык и технологии • Рекомендуемый стек: Python (библиотеки Pyrogram или Telethon), так как это стандарт для разработки юзерботов на сегодняшний день . • База данных: SQLite (для старта) или MongoDB (для масштабирования и лучшей работы с неструктурированными данными) . 6. Состав работ и этапы разработки Этап Описание Результат Этап 0 Анализ и проектирование Детальная схема базы данных, сценарии диалогов (Flowchart), согласование пула из 50 фраз. Этап 1 Ядро системы Реализация мультиаккаунтности (авторизация, сессии, прогрев). Модуль управления очередью с задержкой 10-30 минут. Этап 2 Реализация скрипта A Модуль отправки сообщений с функцией ротации фраз (50+ вариантов). Этап 3 Реализация скрипта B NLP-модуль (на базе регулярных выражений или простых правил) для парсинга цен и сроков из ответов. Модуль генерации уточняющих вопросов. Этап 4 Интерфейс управления и логирование Консольная утилита или простой веб-интерфейс для управления списком таргетов и просмотра статистики. Этап 5 Тестирование Проверка сценариев «счастливый путь», «неполный ответ», «отказ», «без ответа». Этап 6 Документация и сдача Инструкция по развертыванию (Docker/Скрипты) и руководство пользователя. 7. Критерии приёмки 1. Успешно авторизовано и запущено 2 тестовых аккаунта. 2. Прогрев аккаунта выполнен автоматически (или вручную по инструкции). 3. Первое сообщение отправлено с интервалом не менее 10 минут и не более 30 минут. 4. Система корректно распознает цену и срок в ответах (тестовый набор ответов предоставляет Заказчик). 5. При неполном ответе система генерирует корректный уточняющий вопрос.
Москва Фрилансеры

Программисты

дистанционно
договорная
Data Science. Разработка с нуля. Ро.
Москва Фрилансеры

Data scientist

дистанционно
договорная
Разработка с нуля.
Кемерово Фрилансеры

Data scientist

дистанционно
договорная
Разработка с нуля. -.
Москва Фрилансеры

Программисты

дистанционно
договорная
Data Science. Потом.
Санкт-Петербург Фрилансеры

Data scientist

дистанционно
договорная
Разработка с нуля. Пожелания и особенности: Нужна помощь на тестовое задание: дашборд + диаграмма в эксель на 4 чстроки.
Москва Фрилансеры

Программисты

дистанционно
договорная
Data Science. Разработка с нуля. Создание ии агентов.
Москва Фрилансеры