SE::Yandex::Video - Yandex Video scraper

Scraper Overview
The scraper for searching videos on Yandex. Thanks to the SE::Yandex::Video scraper, you can obtain databases of video links. You can use queries in the same way as you enter them in the Yandex search bar.
The A-Parser functionality allows you to save the Yandex scraper's parsing settings for future use (presets), set a parsing schedule, and much more. You can use automatic query multiplication, substitution of subqueries from files, permutation of alphanumeric combinations and lists to get the maximum possible number of results.
Saving results is possible in the form and structure that you need, thanks to the built-in powerful templating engine Template Toolkit which allows you to apply additional logic to the results and output data in various formats, including JSON, SQL, and CSV.
Collected Data
- Video links
- Anchors
- Snippets
- The name of the service where the video is located
- Duration, number of views, and publication date
- Links to the poster and video preview
- Brief video content
- List of sections in the video
- Code for embedding on websites

- Support for filters (brief, fresh)
- Choice of the number of search results pages
Use Cases
- Collecting videos for filling your blogs, tubes, doorways...
- Collecting textual data
As queries, you need to specify search phrases, for example:
Speak in english
Query Substitutions
You can use built-in macros for query multiplication, for example, we want to get a very large database of forums, we will specify several main queries in different languages:
In the query format, we will specify a permutation of characters from a to zzzz, this method allows you to maximally rotate the search output and get many new unique results:
$query {az:a:zzzz}
This macro will create 475254
additional queries for each original search query, which in total will give 4 x 475254 = 1901016
search queries, an impressive figure, but this is not a problem for A-Parser. At a speed of 2000
queries per minute, such a task will be processed in just 16
Output Results Examples
A-Parser supports flexible formatting of results thanks to the built-in templating engine Template Toolkit, which allows it to output results in any form, as well as in structured formats, such as CSV or JSON
Default Output
Result format:
Example of result:
Output in CSV Table
Result format:
[% FOREACH item IN serp;
tools.CSVline(query,, item.anchor, item.prevPoster, item.duration, item.views);
END %]
Example of result:
test,,"<b>Тест</b> на IQ при помощи 10 фото",,07:09,"2,5 млн просмотров"
test,,"Online <b>Test</b> Pad -как самому создать <b>тест</b>",,05:38,"16,6 тыс. просмотров"
test,,"Простой образовательный <b>тест</b>. Online <b>Test</b> Pad",,04:16,"76,5 тыс. просмотров"
test,,"Создаем <b>тесты</b> с Online <b>Test</b> Pad #2",,07:00,"1704 просмотра"
test,,"Этот IQ-<b>тест</b> из 5 Вопросов Покажет Уровень Вашего Интеллекта",,08:01,"606 тыс. просмотров"
test,,"Spotlight 4 класс. Итоговый <b>тест</b>. Exit <b>test</b>",,09:39,
test,,"English grammar <b>test</b>",,12:35,"597 тыс. просмотров"
test,,"ЭТИ Ответы Знают Единицы ""Brain <b>Test</b>"" #1",,17:07,
test,,"Как пройти игру Brain <b>Test</b> 2? Ответы на все уровни",,1:29:03,
test,,"Brain <b>Test</b> Полное прохождение № 4 Погружаемся в мир головоломок",,26:23,
test,,"SpeedTest - Тестирование скорости интернет соединения",,05:16,"223 тыс. просм. всего"
Saving in SQL Format
Result format:
[% FOREACH serp;
"INSERT INTO serp VALUES('" _ query _ "', '";
link _ "', '";
snippet.replace("\n", '\n') _ "', '";
summary.replace("\n", '\n') _ "')\n";
END %]
Example of result:
INSERT INTO serp VALUES('test', '', '', '00:25 Загадка с досками\nВопрос: сколько здесь досок?\nОтвет: нисколько, так как к доскам прорисованы лишние линии и одна доска плавно переходит в другую\n01:10 Загадка с ногами слона\nВопрос: сколько ног у слона?\nОтвет: у слона одна нога, расположенная сзади, а все остальные ноги не настоящие\n02:00 Загадка с женщиной у окна\nВопрос: чем отличаются эти два изображения?\nОтвет: в правом нижнем углу есть мышиная нора')
INSERT INTO serp VALUES('test', '', '', '00:01 Введение\nВ видео рассказывается о сайте онлайн тест пат, где можно создавать тесты, опросы, кроссворды и логические игры.\nДля начала нужно зарегистрироваться с помощью почты.\n00:35 Создание теста\nПосле регистрации можно создавать свои тесты, опросы, кроссворды и логические игры.\nВ видео демонстрируется создание теста с нуля.\n01:06 Варианты вопросов\nВ видео показывается, как создавать разные варианты вопросов: одиночный выбор, ввод текста, заполнение пропусков и другие.\nДемонстрируются примеры вопросов и ответов для каждого варианта.')
INSERT INTO serp VALUES('test', '', '', '00:00 Введение\nВидео представляет собой тест на IQ, состоящий из пяти вопросов, который поможет определить уровень интеллекта.\n04:00 Результаты теста\nЕсли выбраны первые варианты ответов, то уровень счастья высокий, а интеллект средний.\nЕсли выбраны вторые варианты ответов, то уровень интеллекта высокий, а уровень счастья средний.\nЕсли выбраны разные варианты ответов, то уровень интеллекта и счастья находится на золотой середине.\n07:08 Заключение\nВидео призывает поделиться результатами теста с друзьями и подписаться на канал.\nЕсли наберут 50 тысяч лайков, подготовят еще один тест.')
INSERT INTO serp VALUES('test', '', '"Brain <b>Test</b>" ► Прохождение ВСЕМ Приятного Просмотра :) Ссылки: Музыка в Видео: Discord Сервер ► YouTube ►...', '')
INSERT INTO serp VALUES('test', '', 'Прошел игру Brain <b>Test</b> 2. Делюсь ответами на все уровни. Прохождение игры Brain <b>Test</b> 2 все части: Худеем с Настей Побег из тюрьмы Агент Беймс Джонд Семья Всезнайкиных Охотник на монстров Ваня...', '')
INSERT INTO serp VALUES('test', '', ' Канал на Ютубе телеграмм канал помочь с развитием...', '')
Dump Results to JSON
Example of result:
"videos": [
"embed": "<iframe src=\"//\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "",
"snippet": "",
"anchor": "<b>Тест</b> на IQ при помощи 10 фото",
"service": "YouTube"
"embed": "<iframe src=\"//\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "",
"snippet": "",
"anchor": "Online <b>Test</b> Pad -как самому создать <b>тест</b>",
"service": "YouTube"
"embed": "<iframe src=\"//\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "",
"snippet": "",
"anchor": "Простой образовательный <b>тест</b>. Online <b>Test</b> Pad",
"service": "YouTube"
"embed": "<iframe src=\"//\" frameborder=\"0\" scrolling=\"no\" allowfullscreen=\"1\" allow=\"autoplay; fullscreen; accelerometer; gyroscope; picture-in-picture\" aria-label=\"Video\"></iframe>",
"link": "",
"snippet": "",
"anchor": "Создаем <b>тесты</b> с Online <b>Test</b> Pad #2",
"service": "YouTube"
"query": "test"
To make the "Initial text" and "Final text" options available in the Task Editor, you need to activate "More options".
Possible settings
Parameter | Default value | Description |
Pages count | 5 | Number of pages for scraping |
New videos | ☐ | Fresh videos |
Short videos | ☐ | Short videos |