이제 API를 통해 자신의 문서에 대해 ChatGPT를 교육할 수 있습니다.
벤지 에드워즈 - 2023년 8월 23일 오후 8:16 UTC
화요일에 OpenAI는 API를 통해 ChatGPT 무료 버전을 지원하는 AI 모델인 GPT-3.5 Turbo에 대한 미세 조정을 발표했습니다. 회사 문서나 프로젝트 문서와 같은 사용자 정의 데이터로 모델을 교육할 수 있습니다. OpenAI는 미세 조정된 모델이 특정 시나리오에서 더 낮은 비용으로 GPT-4만큼 성능을 발휘할 수 있다고 주장합니다.
AI에서 미세 조정은 사전 훈련된 신경망(예: GPT-3.5 Turbo)을 가져와 일반적으로 더 작고 특정 작업과 관련될 수 있는 다른 데이터세트(예: 사용자 지정 데이터)에서 추가로 훈련하는 프로세스를 의미합니다. 이 프로세스는 초기 훈련 단계에서 모델이 얻은 지식을 기반으로 구축되고 특정 애플리케이션에 맞게 개선됩니다.
따라서 기본적으로 미세 조정은 GPT-3.5 Turbo에 프로젝트 문서 또는 기타 서면 참조와 같은 사용자 정의 콘텐츠에 대해 가르칩니다. 이는 귀하의 제품이나 서비스에 대해 잘 알고 있지만 훈련 데이터(9월 이전에 웹에서 삭제되었음을 상기시켜줌)에 대한 지식이 부족한 GPT-3.5 기반의 AI 도우미를 구축하려는 경우 유용할 수 있습니다. 2021).
OpenAI는 홍보 블로그에 "GPT-3.5 Turbo 출시 이후 개발자와 기업은 사용자에게 독특하고 차별화된 경험을 제공하기 위해 모델을 사용자 정의할 수 있는 기능을 요청했습니다."라고 썼습니다. "이번 출시를 통해 이제 개발자는 감독된 미세 조정을 실행하여 이 모델이 자신의 사용 사례에 더 잘 작동하도록 만들 수 있습니다."
GPT-3.5의 더 강력한 사촌격인 GPT-4는 많은 주제에 적응할 수 있는 제너럴리스트로 잘 알려져 있지만 실행 속도가 느리고 비용이 더 많이 듭니다. OpenAI는 특정 지식 영역에서 더 낮은 비용과 더 빠른 실행 시간으로 GPT-4와 유사한 성능을 얻는 방법으로 3.5 미세 조정을 제안하고 있습니다. "초기 테스트에서는 미세 조정된 GPT-3.5 Turbo 버전이 특정 좁은 작업에서 기본 GPT-4 수준 기능과 일치하거나 심지어 더 뛰어난 성능을 발휘할 수 있는 것으로 나타났습니다."라고 그들은 썼습니다.
또한 OpenAI는 미세 조정된 모델이 "향상된 조종성"을 제공한다고 말합니다. 이는 지침을 더 잘 따르는 것을 의미합니다. API 호출이나 JSON과 같은 형식으로 텍스트를 일관되게 출력하는 모델의 기능을 향상시키는 "신뢰할 수 있는 출력 형식" 그리고 맞춤형 취향이나 개성을 챗봇에 적용할 수 있는 "맞춤형 톤"도 있습니다.
OpenAI는 미세 조정을 통해 사용자가 프롬프트를 단축하고 토큰별로 청구되는 OpenAI API 호출에서 비용을 절약할 수 있다고 말합니다. OpenAI는 "초기 테스터는 모델 자체에 지침을 미세 조정하여 프롬프트 크기를 최대 90%까지 줄였습니다."라고 말합니다. 현재 미세 조정을 위한 컨텍스트 길이는 4,000개 토큰으로 설정되어 있지만 OpenAI는 미세 조정이 "올 가을 후반에" 16,000개 토큰 모델로 확장될 것이라고 밝혔습니다.
지금쯤이면 자신의 데이터를 사용하여 GPT-3.5를 훈련하는 방법과 비용이 궁금할 것입니다. OpenAI는 블로그에서 API를 사용하여 시스템 프롬프트를 설정하고, 훈련을 위해 OpenAI에 파일을 업로드하고, API 웹 주소를 쿼리하기 위해 명령줄 도구 컬을 사용하여 미세 조정 작업을 생성하는 과정을 보여주는 단순화된 프로세스를 제시합니다. OpenAI는 미세 조정 프로세스가 완료되면 기본 모델과 동일한 속도 제한으로 맞춤형 모델을 즉시 사용할 수 있다고 말합니다. 자세한 내용은 OpenAI 공식 문서에서 확인할 수 있습니다.
물론 이 모든 것에는 대가가 따르며 교육 비용과 사용 비용으로 나뉩니다. GPT-3.5 교육 비용은 토큰 1,000개당 $0.008입니다. 사용 단계에서 API 액세스 비용은 텍스트 입력의 경우 토큰 1,000개당 $0.012, 텍스트 출력의 경우 토큰 1,000개당 $0.016입니다.
이에 비해 기본 4k GPT-3.5 Turbo 모델의 비용은 1,000개 토큰 입력당 0.0015달러, 1,000개 토큰 출력당 0.002달러이므로 미세 조정된 모델의 실행 비용은 약 8배 더 비쌉니다. GPT-4의 8K 컨텍스트 모델은 입력 1,000개 토큰당 0.03달러, 출력 1,000개당 0.06달러로 더 저렴하지만 OpenAI는 여전히 미세 조정 모델에서 메시지를 표시할 필요성이 줄어들기 때문에 비용을 절약할 수 있다고 주장합니다. 스트레칭이지만 좁은 경우에는 적용될 수 있습니다.