Новости по акциям компании GOOGLE (ALPHABET)
Новость: негативная. Baidu блокирует сбор контента Google и Bing на фоне спроса на данные, используемые в проектах ИИ. Китайский поисковый гигант Baidu , по всей видимости, начал блокировать поисковым системам Google (Alphabet) и Bing (Microsoft) возможность извлекать контент из сервиса этой китайской компании, работающего в стиле Wikipedia, говорится в исследовании Post. Недавнее обновление файла robots.txt компании Baidu Baike — файла, сообщающего поисковым роботам, к каким унифицированным указателям ресурсов, обычно называемым веб-адресами, можно получить доступ с сайта, — полностью заблокировало возможность роботов Googlebot и Bingbot индексировать контент с китайской платформы. Это обновление, по-видимому, было сделано где-то 8 августа, согласно записям в интернет-архиве Wayback Machine. Оно также показало, что ранее в тот же день Baidu Baike все еще позволял Google и Bing просматривать и индексировать свой онлайн-репозиторий из почти 30 миллионов записей, при этом только часть его веб-сайта была обозначена как закрытая. У вас есть вопросы о самых важных темах и тенденциях со всего мира? Получите ответы с помощью SCMP Knowledge , нашей новой платформы курируемого контента с пояснениями, часто задаваемыми вопросами, анализами и инфографикой, предоставленными вам нашей отмеченной наградами командой. Эта инициатива свидетельствует о возросших усилиях базирующейся в Пекине компании Baidu по защите своих онлайн-активов, поскольку возрос спрос на огромные массивы данных для обучения и создания моделей и приложений искусственного интеллекта (ИИ). Это последовало за шагом американской платформы социальных новостей и форума Reddit в июле, когда она заблокировала различным поисковым системам, кроме Google, индексацию своих онлайн-постов и обсуждений. У Google есть многомиллионная сделка с Reddit, которая дает ей право собирать данные с платформы социальных сетей для обучения своих служб ИИ. По данным Bloomberg, в прошлом году даже Microsoft пригрозила прекратить доступ к своим данным интернет-поиска, которые она лицензирует конкурирующим операторам поисковых систем, если они не прекратят использовать их в качестве основы для своих чат-ботов и других сервисов генеративного искусственного интеллекта (GenAI). Для сравнения, китайская версия онлайн-энциклопедии Wikipedia на сегодняшний день содержит 1,43 миллиона записей, которые доступны поисковым роботам. После обновления файла robots.txt компанией Baidu Baike исследование Google и Bing, проведенное Post в пятницу, выявило, что многие записи (вероятно, из старого кэшированного контента) из сервиса в стиле Википедии по-прежнему появляются в результатах поиска на американских платформах. Представители Baidu, Google и Microsoft в пятницу не отреагировали на просьбы прокомментировать ситуацию. Более чем через два года после новаторского запуска OpenAI's ЧатGPT многие крупные разработчики искусственного интеллекта по всему миру заключают соглашения с издателями контента для доступа к качественному контенту для своих проектов GenAI. GenAI относится к алгоритмам и сервисам, таким как ChatGPT, которые используются для создания нового контента, включая аудио, код, изображения, текст, симуляции и видео. Например, в июне компания OpenAI заключила соглашение с американским новостным журналом Time, которое дает ей доступ ко всему архивному контенту за более чем 100-летнюю историю издания. Источник: www.scmp.com
Пост взят с международного финтех-медиа ресурса
ДЛЯ ЛЮДЕЙ