GPT-5와 OpenAI에서 개발한 새로운 웹 크롤러 GPTBot입니다.

그때까지는 그리 오래 걸리지 않을 것 같아요 OpenAI 인공지능 기반 검색엔진 개발에도 역할을 할 것이다. 새로운 web crawler GPTBot cu modeGPT-5 확장 언어는 이미 출시되었습니다.

사용하시는 분들 ChatGPT 나는이 사실을 알고 mode광범위한 언어의 l(LLM) 현재 실행 중 GPT-3.5, 2021년 XNUMX월에 업데이트된 데이터 세트에 대해 교육을 받고 있습니다. 따라서 이 날짜부터 새로운 정보가 요청되면 ChatGPT 정확한 정보를 제공할 수 없습니다. 물론 보조 플러그인 사용을 지원하지 않는 무료 버전에서도 유효합니다.

출시와 함께 GPTBot, OpenAI 이 새로운 기능을 통해 웹 페이지 인덱싱을 위한 방법이 열려 있습니다. web crawler. Google, Microsoft, Yahoo 및 기타 여러 회사와 같은 회사가 수년 동안 해왔습니다.

GPT-5와 OpenAI에서 개발한 새로운 웹 크롤러 GPTBot입니다.

새로운 web crawler GPTBot 활용하다 web agent:

User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

웹사이트 소유자는 파일을 통해 웹페이지의 인덱싱을 제어할 수 있습니다. robots.txt, 다른 것과 동일한 지시어 사용 web crawler그리고 다른 회사의.

예를 들어 웹사이트 소유자가 원하지 않는 경우 OpenAI 사이트에서 정보를 수집하기 위해 추가할 수 있음 robots.txt 선:

User-agent: GPTBot
Disallow: /

그가 하나처럼 행동해도 web crawler, GPTBot 페이월, 개인 데이터 수집 또는 정책을 위반하는 콘텐츠와 관련된 소스를 조심스럽게 피하면서 공개적으로 사용 가능한 데이터를 수집하는 뚜렷한 목적을 갖습니다. OpenAI.

그러나 꽤 많은 논란이 있으며 일부는 회사에 대한 법적 조치를 취했습니다. OpenAI 저자의 동의 없이 또는 출처를 밝히지 않고 개인 정보 보호 및 콘텐츠 사용에 대해.

지난 XNUMX월 일본의 개인 정보 보호 규제 기관은 경고를 발령했습니다. OpenAI 무단 데이터 수집에 대해. 이탈리아도 올해 초 일시적으로 사용을 금지했다. ChatGPT 유럽 ​​연합 개인 정보 보호법 위반 혐의로 인해.

기술에 대한 열정, 나는 기쁨으로 글을 씁니다. StealthSettings2006년부터 .com을 운영하고 있습니다. 저는 운영 체제 분야에서 폭넓은 경험을 갖고 있습니다. macOS, Windows 과 Linux, 프로그래밍 언어 및 블로그 플랫폼(WordPress) 및 온라인 상점의 경우(WooCommerce, 마젠토, 프레스타샵).

방법 » GPT AI » GPT-5와 OpenAI에서 개발한 새로운 웹 크롤러 GPTBot입니다.
코멘트 남김