Вход Блог
Строительство и ремонт
Репетиторы
Красота
Фрилансеры
Разные специалисты
Тренеры
Уход за животными
Автоинструкторы

Парсинг сайтов — удалённая работа в Москве

Дата: 2026-06-20
Детали
Регион
Москва
Занятость
дистанционно
Стоимость
договорная
Дата публикации
2026-06-20
Описание
Спарсить: цены, объявления. Название заказа: Парсинг анкет сиделок с 6 сайтов (Новосибирск) с выгрузкой в CSV Описание задачи: Необходимо собрать структурированные данные по анкетам сиделок в Новосибирске с перечисленных ниже сайтов. Данные нужны для регрессионного анализа рынка. Список сайтов для парсинга: uslugi.yandex.ru — все анкеты по запросу “сиделка“ в Новосибирске profi.ru — все анкеты в разделе “Сиделки“ по Новосибирску 7hands.com — все анкеты сиделок в Новосибирске pomogatel.ru — все анкеты сиделок в Новосибирске avito.ru — все объявления в разделе “Няни/сиделки“ по Новосибирску opeca-doma.ru — тарифы на услуги (приходящая/суточная/с проживанием) по Новосибирску Технические требования: Сбор всех доступных анкет/объявлений с каждого сайта (не ограничиваться первыми 20–50) Обязательный обход защиты Avito.ru (использовать headless-браузер/прокси/ротацию IP) Эмуляция нажатия кнопок “Показать ещё“ / прокрутка страниц для загрузки всех данных Извлечение полного текста анкеты/описания для последующего анализа Формат выгрузки: Один общий CSV-файл (UTF-8, разделитель запятая) со следующими колонками: source_site — название сайта-источника source_type — aggregator или agency price_hour — цена за час (число, если указана) price_month — цена за месяц (число, если указана) age — возраст (число) experience_years — опыт работы в годах (0 — если нет опыта) phone_verified — 0/1 passport_verified — 0/1 email_verified — 0/1 self_employed — 0/1 district — район города (строка) days_since_last_visit — дней с последнего визита (число) has_medical_skills — 0/1 (проверка текста на слова: уколы, инъекции, массаж, реабилитация, медсестра) has_education_mention — 0/1 (проверка текста на: образование, сертификат, курсы, обучение) live_in — 0/1 (если в тексте есть “проживание“ или готовность жить с подопечным) text_full — полный текст анкеты/объявления Особое указание по opeca-doma.ru: Это сайт агентства, а не агрегатор. Для него парсить не анкеты, а тарифы: занести в CSV 3 строки с ценами (приходящая, суточная, с проживанием) и указать source_type=agency. Срок выполнения: 48 часов с момента подтверждения заказа. Старт работ: понедельник, 22 июня 2026 г. Жёсткий дедлайн: среда, 24 июня 2026 г., 23:59 по МСК. Формат результата: Ссылка на файл (Google Drive / Яндекс.Диск) или вложение в сообщение.
Похожие заказы

Парсинг сайтов

дистанционно
договорная
Спарсить: База кандидатов препод-лей. Пожелания и особенности: Требуется специалист по парсингу данных для сбора базы потенциальных кандидатов на вакансию преподавателя по информатике в онлайн школу. Что необходимо сделать: — Спарсить контакты и профили кандидатов из открытых источников (Telegram, VK, профессиональные сообщества, открытые базы, тематические чаты и другие доступные площадки). — Отобрать аудиторию по заданным критериям (профессия, опыт работы). — Передать результат в Excel или Google Таблице. Что должно быть в итоговой базе: * ФИО (если доступно); * ссылка на профиль: ютуб, тт, инстаграм, Авито. * контакт (телефон или Telegram, если находится в открытом доступе);.
Санкт-Петербург Фрилансеры

Парсинг сайтов

дистанционно
договорная
Спарсить: Контактные данные. Справить информацию из google maps о контактных данных (телефон, сайт, имейл) о компаниях (теннисные корты) в 20 городах по миру.
Москва Фрилансеры

Парсинг сайтов

дистанционно
договорная
Спарсить: Контакты. Требуется собрать актуальную базу контактов лиц, принимающих решения (ЛПР), в таксопарках. Это могут быть владельцы, директора или СPO / CTO / ITD. Главное условие: нужны именно мобильные телефоны (для связи в мессенджерах и прямых звонков). Общие городские номера диспетчерских или форматы 8-800 не подходят. Формат итогового файла (Google Таблицы / Excel): - Название таксопарка - Город / Регион - ФИО или имя ЛПР (если указано) - Мобильный телефон (обязательное поле) - Ссылка на источник (откуда взят контакт) Возможные источники (на ваше усмотрение, парсинг или ручной сбор): - Доски объявлений (Авито, hh.ru) — в вакансиях для водителей часто оставляют прямые мобильные номера руководителей. - Карты и справочники (2ГИС, Яндекс.Карты) — с фильтрацией на мобильные номера. - Профильные форумы, Telegram-чаты и группы ВКонтакте. - Базы юрлиц и реестры. Требования к качеству: - 100% отсутствие дубликатов. - Только валидные номера (без несуществующих или неполных). - Отсутствие мусорных контактов (номера техподдержки агрегаторов такси и т.д.). Как откликнуться на задание: Пожалуйста, в вашем отклике сразу укажите: - Какую стоимость вы берете за 100 валидных контактов (или укажите цену за 1 строку). - Примерные сроки на сбор тестовой базы из 500 контактов.
Екатеринбург Фрилансеры

Парсинг сайтов

дистанционно
договорная
Спарсить: новости. Есть приблизительно 40 сайтов с новостями о различных грантах. Оттуда необходимо парсить информацию об этих грантах в виде краткой сводки в excel таблицу. Эта excel таблица содержит информацию со всеми грантами со всех источников. Нужно добавить фильтры по разным столбцам в excel таблицу, чтобы человек мог сам отфильтровать гранты под себя и видеть нужную информацию.
Москва Фрилансеры

Парсинг сайтов

дистанционно
договорная
Спарсить: цены, объявления. Название заказа: Парсинг анкет сиделок с 6 сайтов (Новосибирск) с выгрузкой в CSV Описание задачи: Необходимо собрать структурированные данные по анкетам сиделок в Новосибирске с перечисленных ниже сайтов. Данные нужны для регрессионного анализа рынка. Список сайтов для парсинга: uslugi.yandex.ru — все анкеты по запросу "сиделка" в Новосибирске profi.ru — все анкеты в разделе "Сиделки" по Новосибирску 7hands.com — все анкеты сиделок в Новосибирске pomogatel.ru — все анкеты сиделок в Новосибирске avito.ru — все объявления в разделе "Няни/сиделки" по Новосибирску opeca-doma.ru — тарифы на услуги (приходящая/суточная/с проживанием) по Новосибирску Технические требования: Сбор всех доступных анкет/объявлений с каждого сайта (не ограничиваться первыми 20–50) Обязательный обход защиты Avito.ru (использовать headless-браузер/прокси/ротацию IP) Эмуляция нажатия кнопок "Показать ещё" / прокрутка страниц для загрузки всех данных Извлечение полного текста анкеты/описания для последующего анализа Формат выгрузки: Один общий CSV-файл (UTF-8, разделитель запятая) со следующими колонками: source_site — название сайта-источника source_type — aggregator или agency price_hour — цена за час (число, если указана) price_month — цена за месяц (число, если указана) age — возраст (число) experience_years — опыт работы в годах (0 — если нет опыта) phone_verified — 0/1 passport_verified — 0/1 email_verified — 0/1 self_employed — 0/1 district — район города (строка) days_since_last_visit — дней с последнего визита (число) has_medical_skills — 0/1 (проверка текста на слова: уколы, инъекции, массаж, реабилитация, медсестра) has_education_mention — 0/1 (проверка текста на: образование, сертификат, курсы, обучение) live_in — 0/1 (если в тексте есть "проживание" или готовность жить с подопечным) text_full — полный текст анкеты/объявления Особое указание по opeca-doma.ru: Это сайт агентства, а не агрегатор. Для него парсить не анкеты, а тарифы: занести в CSV 3 строки с ценами (приходящая, суточная, с проживанием) и указать source_type=agency. Срок выполнения: 48 часов с момента подтверждения заказа. Старт работ: понедельник, 22 июня 2026 г. Жёсткий дедлайн: среда, 24 июня 2026 г., 23:59 по МСК. Формат результата: Ссылка на файл (Google Drive / Яндекс.Диск) или вложение в сообщение.
Новосибирск Фрилансеры

Парсинг сайтов

дистанционно
договорная
Спарсить: Реестр ФСА. Нужен человек, который изучит сайт ФСА, и скажет, можно ли через API сделать выгрузку всего реестра декларация, как раньше можно было. Если нет, то помочь с парсингом этого сайта. https://pub.fsa.gov.ru/rds/declaration.
Москва Фрилансеры