Вход | Регистрация


1С:Предприятие :: 1С:Предприятие 8 общая

Парсер translate.google.com

Парсер translate.google.com
Я
   IvanGorbunov
 
28.12.18 - 14:39
Пытаюсь сделать перевод путем парсинга гугловского переводчика. Пока не получается даже получить тело html документа по ссылке:
Пишу такой код:

    АдресСайта = "https://translate.google.ru/#view=home&op=translate&sl=en&tl=ru&text=nut";;

    СтруктураАдресаСайта = РазобратьАдресСайта(АдресСайта);
    ИмяВременногоФайлаТекстHTML = ПолучитьИмяВременногоФайла("html");
    
    Попытка
        //подключаемся к домену
        HTTPСервис = Новый HTTPСоединение(СтруктураАдресаСайта.Домен);
        //получаем конкретную страницу сайта и скачиваем ее во временный файл
        HTTPСервис.Получить(СтруктураАдресаСайта.Запрос, ИмяВременногоФайлаТекстHTML);
    Исключение
        Сообщить(ОписаниеОшибки(), СтатусСообщения.Важное);
        Возврат;
    КонецПопытки;
    
    ЧтениеHTML = Новый ЧтениеHTML;
    ЧтениеHTML.ОткрытьФайл(ИмяВременногоФайлаТекстHTML, "UTF8");
    
    ПостроительDOM = Новый ПостроительDOM;
    ДокументHTML   = ПостроительDOM.Прочитать(ЧтениеHTML);

Возвращает ошибку "302 Moved"
 
 
   Вафель
 
1 - 28.12.18 - 14:45
смотри куда же он мувед
   Вафель
 
2 - 28.12.18 - 14:46
это в заголовках должно быть
   IvanGorbunov
 
3 - 28.12.18 - 14:58
(2) Вот он мне говорит, что документ мувед, дальше ссылка на "https://translate.google.ru/";
   Вафель
 
4 - 28.12.18 - 15:05
fetch("https://translate.google.ru/";)
в браузере не выдает 304
   IvanGorbunov
 
5 - 28.12.18 - 15:07
(4) не понял вас)
   Garikk
 
6 - 28.12.18 - 15:15
А зачем его парсить если api есть?
   IvanGorbunov
 
7 - 28.12.18 - 15:17
(6) так оно платное
   IvanGorbunov
 
8 - 28.12.18 - 15:18
как я понял, гугл определяет, что это машина стучится, а не человек, а это нарушает правила использования сервиса
   Cyberhawk
 
9 - 28.12.18 - 15:26
Держи карман шире
   Fragster
 
10 - 28.12.18 - 15:29
 
 Рекламное место пустует
   IvanGorbunov
 
11 - 28.12.18 - 15:34
(10) спасибо, но слишком сразу не очевидно, нет столько времени, чтобы разбираться с таким вариантов
   Fragster
 
12 - 28.12.18 - 15:35
(11) сэкономишь больше времени. Запустить приложение вместо парсинга страницы, которая на js работает
   Garikk
 
13 - 28.12.18 - 15:43
(7) как бизьнес так норм счета выставлять, а как переводчик так "платное"
А может и 1С у вас ворованый?
:)
   sitex
 
14 - 28.12.18 - 16:00
(0) Есть подобное с использованием WinHttp.WinHttpRequest.5.1".

(8) Если ты про reкапчу то надо в куках взять GOOGLE_ABUSE_EXEMPTION=ID и передавать.
   novichok79
 
15 - 28.12.18 - 16:02
   novichok79
 
16 - 28.12.18 - 16:05
а оно денег хочет. понятно
   novichok79
 
17 - 28.12.18 - 16:07
»
   Вафель
 
18 - 28.12.18 - 16:15
зачем ты css сюда вывалил?
   Скиурус
 
19 - 28.12.18 - 16:29
Так просто для сведения, этот move вас хочет отмувить на https версию страницы. Чтобы сразу зайти на https нужно В HTTPСоединение установить Новый ЗащищенноеСоединениеOpenSSL(Новый СертификатКлиентаWindows(), Новый СертификатыУдостоверяющихЦентровWindows());
Но с гуглем так просто это не поможет, потому как слова "орех" вы в исходнике страницы не найдете - AJAX, однако
   sitex
 
20 - 28.12.18 - 16:45
Спец нашел в своем хламе, две старые версии translate.google.com, проверить какая из них рабочая.
1)Которая парсить html уже не рабочая.
2) Которая возвращает сразу результат перевод вроде еще живая (но ест-но без танцев не обошлось).
   novichok79
 
21 - 28.12.18 - 17:32
(18) соррян, не знал что оно будет настолько большим.
   xaozai
 
22 - 28.12.18 - 17:51
(0) А зачем вы через задний проход эту задачу решаете?
Есть же API.
https://cloud.google.com/translate/docs/
   xaozai
 
23 - 28.12.18 - 17:52
Уже готовое даже есть: http://catalog.mista.ru/public/128449/
   Вафель
 
24 - 28.12.18 - 17:56
так онож платное
   Генератор
 
25 - 28.12.18 - 18:27
тоже пытался через гугл, в итоге сделал через яндекс api
   Garikk
 
26 - 28.12.18 - 18:40
яндекс лучше гугла переводит... гугл лет 5 назад испохабил переаодчик до невозможности, он реально на основании поисковых запросов переводы делает


Список тем форума
  Рекламное место пустует
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.
Рекламное место пустует