Page 2 of 2 FirstFirst 12
Results 11 to 13 of 13

Thread: Definitions

  1. #11
    Вручную такую работу вряд ли проделаешь. Но её можно автоматизировать тем же методом, о котором я писал раньше. Генерируете заведомо несуществующие ссылки lllll.com/abrakadabra cо всеми возможными двухбуквенными, трёхбуквенными, четырёх- и пятибуквенными .com (их больше миллиона) и выбираете те из них, которые возвращают коды 200, 403 и т.д. Аналогичный подход можно применить и к ссылкам на социальные сети.

  2. #12
    Такой подход не подходит по следующим причинам:
    1) мы нагенерим битых ссылок всего лишь для 1 го типа, который, как мне видится, не является сложным для распознавания и без ИИ
    2) нам нужны проблемы в интернете - как они есть. В этом будет смысл обучения нейронки. Если мы научим ее тому, что сами нагенерили - шансы что мы решим проблему глобально стремятся к нулю.

  3. #13
    Мне кажется, что среди миллиона сгенерированных ссылок будут такие, то есть с таких сайтов, где не настроили корректно коды возврата, соответствующие признанным стандартам, то есть ссылка будет битая, а код будет возвращаться 200, как у валидной ссылки, или будет возвращаться 403, или ещё какой-то, но не 404. А нас же, насколько я понимаю, интересуют такие ссылки, которые не распознаются по возвращаемым кодам. А это как раз и будут такие.

Page 2 of 2 FirstFirst 12

Социальные закладки

Социальные закладки

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •