-
27th December 2021, 23:53
#11
Senior Member
Вручную такую работу вряд ли проделаешь. Но её можно автоматизировать тем же методом, о котором я писал раньше. Генерируете заведомо несуществующие ссылки lllll.com/abrakadabra cо всеми возможными двухбуквенными, трёхбуквенными, четырёх- и пятибуквенными .com (их больше миллиона) и выбираете те из них, которые возвращают коды 200, 403 и т.д. Аналогичный подход можно применить и к ссылкам на социальные сети.
-
27th December 2021, 23:53
#12
Senior Member
Такой подход не подходит по следующим причинам:
1) мы нагенерим битых ссылок всего лишь для 1 го типа, который, как мне видится, не является сложным для распознавания и без ИИ
2) нам нужны проблемы в интернете - как они есть. В этом будет смысл обучения нейронки. Если мы научим ее тому, что сами нагенерили - шансы что мы решим проблему глобально стремятся к нулю.
-
27th December 2021, 23:53
#13
Senior Member
Мне кажется, что среди миллиона сгенерированных ссылок будут такие, то есть с таких сайтов, где не настроили корректно коды возврата, соответствующие признанным стандартам, то есть ссылка будет битая, а код будет возвращаться 200, как у валидной ссылки, или будет возвращаться 403, или ещё какой-то, но не 404. А нас же, насколько я понимаю, интересуют такие ссылки, которые не распознаются по возвращаемым кодам. А это как раз и будут такие.
Posting Permissions
- You may not post new threads
- You may not post replies
- You may not post attachments
- You may not edit your posts
-
Forum Rules
Социальные закладки