SE::Yandex::Speller - Checking pages for text errors via Yandex.Speller
Parser Overview
SE::Yandex::Speller - finds spelling errors in Russian, Ukrainian, or English text on the specified page via the Yandex.Speller service. Language models include hundreds of millions of words and phrases.The functionality of A-Parser allows you to save the parsing settings of the SE::Yandex::Speller scraper for further use (presets), set up a parsing schedule, and much more.
Saving the results is possible in the format and structure you need, thanks to the built-in powerful templating engine Template Toolkit which allows applying additional logic to the results and outputting data in various formats, including JSON, SQL, and CSV.
Collected Data
- Text blocks where errors were found
Capabilities
- Determining the number of blocks with errors
- Outputting possible reasons for errors in the text
Use Cases
- Finding the number of text blocks with errors
- Checking website pages for spelling errors in the text
- Checking spelling on website pages
Queries
As queries, you need to specify the address of the website page that needs to be checked, for example:
https://a-parser.com/
Output Results Examples
A-Parser supports flexible formatting of results thanks to the built-in templating engine Template Toolkit, allowing it to output results in any form, as well as in a structured form, for example, CSV or JSON
Default Output
Result format:
$query: $total\n$errors.format('$word ($suggest) - $type\n')
Result example:
https://a-parser.com: 44
SaaS (Seas) - Слова нет в словаре.
фрилансеры () - Слова нет в словаре.
Арбитражники (Арбитраж ники) - Слова нет в словаре.
Youtube (YouTube) - Неверное употребление прописных и строчных букв.
емейлы (мейлы) - Слова нет в словаре.
WordStat () - Слова нет в словаре.
Линкбилдинг () - Слова нет в словаре.
аутрич () - Слова нет в словаре.
Alexa () - Слова нет в словаре.
SEMRush () - Слова нет в словаре.
Ahrefs (Href) - Слова нет в словаре.
...
Saving in SQL Format
Result format:
[% FOREACH errors;
"INSERT INTO errors VALUES('" _ word _ "', '" _ suggest _ "', '" _ type _ "')\n";
END %]
Result example:
INSERT INTO errors VALUES('SaaS', 'Seas', 'Слова нет в словаре.')
INSERT INTO errors VALUES('фрилансеры', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Арбитражники', 'Арбитраж ники', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Youtube', 'YouTube', 'Неверное употребление прописных и строчных букв.')
INSERT INTO errors VALUES('емейлы', 'мейлы', 'Слова нет в словаре.')
INSERT INTO errors VALUES('WordStat', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Линкбилдинг', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('аутрич', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Alexa', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SEMRush', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('Ahrefs', 'Href', 'Слова нет в словаре.')
INSERT INTO errors VALUES('MajesticSEO', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SerpStat', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('фрилансеры', '', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SaaS', 'Saab,Seas,SAS', 'Слова нет в словаре.')
INSERT INTO errors VALUES('SaaS', 'Seas,SAS', 'Слова нет в словаре.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', 'Слова нет в словаре.')
INSERT INTO errors VALUES('NodeJS', 'Nodes', 'Слова нет в словаре.')
INSERT INTO errors VALUES('async', 'sync', 'Слова нет в словаре.')
INSERT INTO errors VALUES('лидогенерации', 'лидо генерации', 'Слова нет в словаре.')
Dump Results to JSON
General result format:
[% IF notFirst;
",\n";
ELSE;
notFirst = 1;
END;
obj = {};
obj.errors = p1.errors;
obj.json %]
Initial text:
[
Final text:
]
Result example:
[{"errors": [{"word":"SaaS","suggest":"Seas","type":"Слова нет в словаре."},{"word":"фрилансеры","suggest":"","type":"Слова нет в словаре."},{"word":"Арбитражники","suggest":"Арбитраж ники","type":"Слова нет в словаре."},{"word":"Youtube","suggest":"YouTube","type":"Неверное употребление прописных и строчных букв."},{"word":"емейлы","suggest":"мейлы","type":"Слова нет в словаре."},{"word":"WordStat","suggest":"","type":"Слова нет в словаре."},{"word":"Линкбилдинг","suggest":"","type":"Слова нет в словаре."},{"word":"аутрич","suggest":"","type":"Слова нет в словаре."},{"word":"Alexa","suggest":"","type":"Слова нет в словаре."},{"word":"SEMRush","suggest":"","type":"Слова нет в словаре."},{"word":"Ahrefs","suggest":"Href","type":"Слова нет в словаре."},{"word":"MajesticSEO","suggest":"","type":"Слова нет в словаре."},{"word":"SerpStat","suggest":"","type":"Слова нет в словаре."},{"word":"фрилансеры","suggest":"","type":"Слова нет в словаре."},{"word":"SaaS","suggest":"Saab,Seas,SAS","type":"Слова нет в словаре."},{"word":"SaaS","suggest":"Seas,SAS","type":"Слова нет в словаре."},{"word":"NodeJS","suggest":"Nodes","type":"Слова нет в словаре."},{"word":"Parser'а","suggest":"","type":"Слова нет в словаре."},{"word":"NodeJS","suggest":"Nodes","type":"Слова нет в словаре."},{"word":"async","suggest":"sync","type":"Слова нет в словаре."},{"word":"лидогенерации","suggest":"лидо генерации","type":"Слова нет в словаре."},{"word":"Парсите","suggest":"Парите","type":"Слова нет в словаре."},{"word":"Instagram","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейсы","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейсов","suggest":"","type":"Слова нет в словаре."},{"word":"маркетплейс","suggest":"","type":"Слова нет в словаре."},{"word":"Instagram","suggest":"","type":"Слова нет в словаре."},{"word":"Bing","suggest":"","type":"Слова нет в словаре."},{"word":"новостники","suggest":"","type":"Слова нет в словаре."},{"word":"Redis","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"","type":"Слова нет в словаре."},{"word":"каптч","suggest":"","type":"Слова нет в словаре."},{"word":"XEvil","suggest":"Evil,Devil","type":"Слова нет в словаре."},{"word":"CapMonster","suggest":"Cap Monster","type":"Слова нет в словаре."},{"word":"Captcha","suggest":"","type":"Слова нет в словаре."},{"word":"RuCaptcha","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"спорить","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"","type":"Слова нет в словаре."},{"word":"спарсить","suggest":"запросить","type":"Слова нет в словаре."},{"word":"бриф","suggest":"","type":"Слова нет в словаре."},{"word":"тикетов","suggest":"","type":"Слова нет в словаре."},{"word":"Parser’ом","suggest":"","type":"Слова нет в словаре."},{"word":"Parser'ом","suggest":"","type":"Слова нет в словаре."},{"word":"тулзов","suggest":"узлов,тузов,тулов","type":"Слова нет в словаре."}]}]
Possible Settings
Parameter | Default Value | Description |
---|---|---|
Languages | English, Russian, Ukrainian | Check languages |
Options | Skip words written in capital letters, for example, "VPC"., Skip words with numbers, for example, "avp17x4534"., Skip internet addresses, email addresses, and file names., Ignore Roman numerals ("I, II, III, ..."). | Check options |
HTML::TextExtractor preset | default | Preset for HTML::TextExtractor. Allows specifying text parsing settings |