Skip to main content

SE::Yandex::Speller - Checking pages for text errors via Yandex.Speller

Parser Overview

SE::Yandex::Speller

SE::Yandex::SpellerSE::Yandex::Speller - finds spelling errors in Russian, Ukrainian, or English text on the specified page via the Yandex.Speller service. Language models include hundreds of millions of words and phrases.

The functionality of A-Parser allows you to save the parsing settings of the SE::Yandex::Speller scraper for further use (presets), set up a parsing schedule, and much more.

Saving the results is possible in the format and structure you need, thanks to the built-in powerful templating engine Template Toolkit which allows applying additional logic to the results and outputting data in various formats, including JSON, SQL, and CSV.

Collected Data

  • Text blocks where errors were found

Capabilities

  • Determining the number of blocks with errors
  • Outputting possible reasons for errors in the text

Use Cases

  • Finding the number of text blocks with errors
  • Checking website pages for spelling errors in the text
  • Checking spelling on website pages

Queries

As queries, you need to specify the address of the website page that needs to be checked, for example:

https://a-parser.com/

Output Results Examples

A-Parser supports flexible formatting of results thanks to the built-in templating engine Template Toolkit, allowing it to output results in any form, as well as in a structured form, for example, CSV or JSON

Default Output

Result format:

$query: $total\n$errors.format('$word ($suggest) - $type\n')

Result example:

https://a-parser.com: 44
SaaS (Seas) - Слова нет в словаре.
фрилансеры () - Слова нет в словаре.
Арбитражники (Арбитраж ники) - Слова нет в словаре.
Youtube (YouTube) - Неверное употребление прописных и строчных букв.
емейлы (мейлы) - Слова нет в словаре.
WordStat () - Слова нет в словаре.
Линкбилдинг () - Слова нет в словаре.
аутрич () - Слова нет в словаре.
Alexa () - Слова нет в словаре.
SEMRush () - Слова нет в словаре.
Ahrefs (Href) - Слова нет в словаре.
...

Saving in SQL Format

Result format:

[% FOREACH errors;
"INSERT INTO errors VALUES('" _ word _ "', '" _ suggest _ "', '" _ type _ "')\n";
END %]

Result example:

INSERT INTO errors VALUES('SaaS', 'Seas', 'Слова нет в словаре.')
INSERT INTO errors VALUES('фрилансеры', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Арбитражники', 'Арбитраж ники', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Youtube', 'YouTube', 'Неверное употребление прописных и строчных букв.')
INSERT INTO errors VALUES('емейлы', 'мейлы', 'Слова нет в словаре.')
INSERT INTO errors VALUES('WordStat', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Линкбилдинг', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('аутрич', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Alexa', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SEMRush', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Ahrefs', 'Href', 'Слова нет в словаре.')
INSERT INTO errors VALUES('MajesticSEO', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SerpStat', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('фрилансеры', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SaaS', 'Saab,Seas,SAS', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SaaS', 'Seas,SAS', 'Слова нет в словаре.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', 'Слова нет в словаре.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', 'Слова нет в словаре.')
INSERT INTO errors VALUES('async', 'sync', 'Слова нет в словаре.')
INSERT INTO errors VALUES('лидогенерации', 'лидо генерации', 'Слова нет в словаре.')

Dump Results to JSON

General result format:

[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;

obj = {};
obj.errors = p1.errors;

obj.json %]

Initial text:

[

Final text:

]

Result example:

[{"errors": [{"word":"SaaS","suggest":"Seas","type":"Слова нет в словаре."},{"word":"фрилансеры","suggest":"","type":"Слова нет в словаре."},{"word":"Арбитражники","suggest":"Арбитраж ники","type":"Слова нет в словаре."},{"word":"Youtube","suggest":"YouTube","type":"Неверное употребление прописных и строчных букв."},{"word":"емейлы","suggest":"мейлы","type":"Слова нет в словаре."},{"word":"WordStat","suggest":"","type":"Слова нет в словаре."},{"word":"Линкбилдинг","suggest":"","type":"Слова нет в словаре."},{"word":"аутрич","suggest":"","type":"Слова нет в словаре."},{"word":"Alexa","suggest":"","type":"Слова нет в словаре."},{"word":"SEMRush","suggest":"","type":"Слова нет в словаре."},{"word":"Ahrefs","suggest":"Href","type":"Слова нет в словаре."},{"word":"MajesticSEO","suggest":"","type":"Слова нет в словаре."},{"word":"SerpStat","suggest":"","type":"Слова нет в словаре."},{"word":"фрилансеры","suggest":"","type":"Слова нет в словаре."},{"word":"SaaS","suggest":"Saab,Seas,SAS","type":"Слова нет в словаре."},{"word":"SaaS","suggest":"Seas,SAS","type":"Слова нет в словаре."},{"word":"NodeJS","suggest":"Nodes","type":"Слова нет в словаре."},{"word":"Parser'а","suggest":"","type":"Слова нет в словаре."},{"word":"NodeJS","suggest":"Nodes","type":"Слова нет в словаре."},{"word":"async","suggest":"sync","type":"Слова нет в словаре."},{"word":"лидогенерации","suggest":"лидо генерации","type":"Слова нет в словаре."},{"word":"Парсите","suggest":"Парите","type":"Слова нет в словаре."},{"word":"Instagram","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейсы","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейсов","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейс","suggest":"","type":"Слова нет в словаре."},{"word":"Instagram","suggest":"","type":"Слова нет в словаре."},{"word":"Bing","suggest":"","type":"Слова нет в словаре."},{"word":"новостники","suggest":"","type":"Слова нет в словаре."},{"word":"Redis","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"","type":"Слова нет в словаре."},{"word":"каптч","suggest":"","type":"Слова нет в словаре."},{"word":"XEvil","suggest":"Evil,Devil","type":"Слова нет в словаре."},{"word":"CapMonster","suggest":"Cap Monster","type":"Слова нет в словаре."},{"word":"Captcha","suggest":"","type":"Слова нет в словаре."},{"word":"RuCaptcha","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"спорить","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"запросить","type":"Слова нет в словаре."},{"word":"бриф","suggest":"","type":"Слова нет в словаре."},{"word":"тикетов","suggest":"","type":"Слова нет в словаре."},{"word":"Parser’ом","suggest":"","type":"Слова нет в словаре."},{"word":"Parser'ом","suggest":"","type":"Слова нет в словаре."},{"word":"тулзов","suggest":"узлов,тузов,тулов","type":"Слова нет в словаре."}]}]

Possible Settings

ParameterDefault ValueDescription
LanguagesEnglish, Russian, UkrainianCheck languages
OptionsSkip words written in capital letters, for example, "VPC"., Skip words with numbers, for example, "avp17x4534"., Skip internet addresses, email addresses, and file names., Ignore Roman numerals ("I, II, III, ...").Check options
HTML::TextExtractor presetdefaultPreset for HTML::TextExtractorHTML::TextExtractor. Allows specifying text parsing settings