GPT-4o: 가장 진보된 플래그쉽 AI 모델 발표 19
5/14일 새벽2시, OpenAI가 라이브 방송으로 GPT-4o 모델을 공개했습니다.
이 최신 모델은 기존 GPT 4의 지능을 갖고 있지만 응답속도가 훨씬 빠르며
텍스트, 음성 뿐만 아니라 실시간 영상을 인식해서 처리할 수 있습니다.
(한국어 처리 능력도 1.7배 적은 토큰을 사용하도록 개선되었다고 하네요)
아래는 금일 발표된 영상 일부와 내용 설명입니다.
1.라이브 발표 영상
지연시간이 없다시피 한 실시간 대화 기능을 선보이고, 외국어 실시간 통역을 수행하며
화상통화에 가까운 비전 인식 기능을 살펴볼 수 있습니다.
2.실시간 대화: 강아지 Bowser
휴대폰 카메라를 통해 실시간으로 강아지를 인식하며 풍부한 감정을 담은 대화를 할 수 있습니다.
3.실시간 대화: 다자간 화상컨퍼런스
화상채팅을 하는 4명의 인간과 한 명(?)의 AI입니다.
레이턴시 없이 자연스럽고 부드러운 대화를 이어가는데 목소리에 대한 칭찬과 회의 내용 요약이 돋보입니다.
4.실시간 대화: AI끼리의 대화 + 상황인식 + 노래부르기
2명(?)의 AI가 서로 대화를 하고 나중엔 노래를 한소절씩 나눠부릅니다.
중간에 다른 직원이 난입해서 장난을 치는데 AI가 모른척하다가 뭔가 특이한거 없었냐 물어보니 그제서야 봤다고 대답합니다.
GPT-4o의 텍스트/이미지 기능부터 점진적 배포로 제공하고 음성 기능은 몇주안에 유료유저에게 제공할 예정이라고 합니다.
특이한 것은 Desktop 버전 앱을 발표하는데 맥용은 즉시 제공하고 윈도우 버전은 연내 출시라네요.
아래는 OpenAI 사이트에 공개된 소개 자료를 GPT-4o 모델로 번역한 것입니다.
(다섯줄 요약)
- GPT-4o는 실용성을 목표로 한 최신 딥러닝 모델로, 효율성을 개선하여 널리 제공됩니다.
- 오늘부터 ChatGPT에서 텍스트 및 이미지 기능을 롤아웃하며, 무료 등급과 Plus 사용자에게 최대 5배 더 높은 메시지 한도를 제공합니다.
- 몇 주 안에 ChatGPT Plus에 새로운 음성 모드가 알파 버전으로 롤아웃될 예정입니다.
- 개발자들은 이제 GPT-4o에 API를 통해 접근할 수 있으며, GPT-4 Turbo보다 2배 빠르고 가격은 절반, 속도 제한은 5배 더 높습니다.
- 몇 주 안에 소수의 신뢰할 수 있는 파트너에게 API를 통해 오디오 및 비디오 기능 지원을 시작할 계획입니다.
(풀텍스트)
GPT-4o 및 더 많은 도구를 ChatGPT 무료 사용자에게 소개합니다
GPT-4o는 GPT-4 수준의 지능을 제공하는 최신 플래그십 모델로, 훨씬 빠르고 텍스트, 음성, 비전 기능 전반에 걸쳐 성능을 향상시켰습니다.
오늘날 GPT-4o는 사용자가 공유하는 이미지를 이해하고 논의하는 데 있어 기존 모델보다 훨씬 뛰어납니다. 예를 들어, 다른 언어로 된 메뉴 사진을 찍어 GPT-4o와 대화하여 이를 번역하고, 음식의 역사와 중요성에 대해 배우고, 추천을 받을 수 있습니다. 향후 개선 사항으로는 보다 자연스러운 실시간 음성 대화 및 실시간 비디오를 통한 ChatGPT와의 대화가 가능해질 것입니다. 예를 들어, 라이브 스포츠 경기를 보여주고 규칙을 설명해 달라고 할 수 있습니다. 이러한 새로운 기능을 갖춘 새로운 음성 모드를 향후 몇 주 안에 알파 버전으로 출시할 계획이며, Plus 사용자에게는 조기 액세스 권한을 제공하면서 더 널리 롤아웃할 예정입니다.
전 세계적으로 고급 AI를 더 쉽게 접근하고 유용하게 만들기 위해 GPT-4o의 언어 기능은 품질과 속도 측면에서 향상되었습니다. ChatGPT는 이제 가입 및 로그인, 사용자 설정 등에서 50개 이상의 언어를 지원합니다.
우리는 GPT-4o를 ChatGPT Plus 및 팀 사용자에게 출시하기 시작했으며, 곧 엔터프라이즈 사용자에게도 제공할 예정입니다. 또한 오늘부터 ChatGPT 무료 사용자에게 사용 제한과 함께 점진적으로 롤아웃할 예정입니다. Plus 사용자는 무료 사용자보다 최대 5배 더 많은 메시지 제한을 가지며, 팀 및 엔터프라이즈 사용자는 더 높은 제한을 가지게 됩니다.
더 많은 지능과 고급 도구를 무료로 제공 우리의 사명은 가능한 많은 사람들에게 고급 AI 도구를 제공하는 것입니다. 매주 1억 명이 넘는 사람들이 ChatGPT를 사용하고 있습니다. 우리는 앞으로 몇 주 동안 ChatGPT 무료 사용자에게 더 많은 지능과 고급 도구를 점진적으로 롤아웃할 예정입니다.
GPT-4o를 사용할 때 ChatGPT 무료 사용자는 이제 다음과 같은 기능에 액세스할 수 있습니다:
- GPT-4 수준의 지능 체험
- 모델 및 웹에서 응답 받기 (새 창에서 열림)
- 데이터 분석 및 차트 생성 (새 창에서 열림)
- 촬영한 사진에 대해 대화
- 파일 업로드를 통한 요약, 작성 또는 분석 지원 (새 창에서 열림)
- GPT 및 GPT 스토어 탐색 및 사용
- 메모리를 통해 더 유용한 경험 구축
사용량과 수요에 따라 무료 사용자가 GPT-4o로 보낼 수 있는 메시지 수에 제한이 있을 것입니다. 제한에 도달하면 ChatGPT는 자동으로 GPT-3.5로 전환되어 사용자가 대화를 계속할 수 있도록 합니다.
새로운 데스크탑 앱에서 워크플로우 간소화 무료 및 유료 사용자 모두를 위해 macOS용 새로운 ChatGPT 데스크탑 앱을 출시하여 컴퓨터에서 수행하는 작업에 원활하게 통합되도록 설계되었습니다. 간단한 키보드 단축키 (Option + Space)로 즉시 ChatGPT에 질문할 수 있습니다. 또한 앱에서 직접 스크린샷을 찍고 논의할 수 있습니다.
이제 컴퓨터에서 바로 ChatGPT와 음성 대화를 할 수 있으며, 시작 시 사용할 수 있었던 음성 모드를 시작으로 GPT-4o의 새로운 오디오 및 비디오 기능이 곧 추가될 예정입니다. 회사의 새로운 아이디어를 브레인스토밍하거나 면접을 준비하거나 논의할 주제가 있을 때, 데스크탑 앱 하단 오른쪽 모서리에 있는 헤드폰 아이콘을 탭하여 음성 대화를 시작할 수 있습니다.
macOS용 앱을 오늘부터 Plus 사용자에게 롤아웃하고 있으며, 앞으로 몇 주 안에 더 널리 제공할 예정입니다. 올해 말에는 Windows 버전도 출시할 계획입니다.
ChatGPT의 간소화된 새로운 모습 ChatGPT의 새로운 홈 화면, 메시지 레이아웃 등 더 친근하고 대화형으로 디자인된 새로운 모습과 느낌을 소개합니다.
모델 가용성(Model Availability)
GPT-4o는 이번에 실용성을 목표로 딥러닝의 경계를 확장하기 위한 최신 단계입니다. 우리는 지난 2년 동안 모든 계층에서 효율성 향상에 많은 노력을 기울였습니다. 이 연구의 첫 번째 성과로, 우리는 GPT-4 수준의 모델을 훨씬 더 널리 제공할 수 있게 되었습니다. GPT-4o의 기능은 점진적으로 롤아웃될 예정입니다 (오늘부터 확장된 레드 팀 접근 권한이 시작됩니다).
GPT-4o의 텍스트 및 이미지 기능은 오늘부터 ChatGPT에서 롤아웃되기 시작합니다. 우리는 GPT-4o를 무료 등급에서도 사용할 수 있게 하고, Plus 사용자에게는 최대 5배 더 높은 메시지 한도로 제공합니다. GPT-4o의 새로운 음성 모드는 몇 주 안에 ChatGPT Plus의 알파 버전으로 롤아웃될 예정입니다.
개발자들은 이제 텍스트 및 비전 모델로서의 GPT-4o에 API를 통해 접근할 수 있습니다. GPT-4o는 GPT-4 Turbo에 비해 2배 더 빠르고, 가격은 절반이며, 5배 더 높은 속도 제한을 가지고 있습니다. 우리는 몇 주 안에 신뢰할 수 있는 소수의 파트너 그룹에 API를 통해 GPT-4o의 새로운 오디오 및 비디오 기능 지원을 출시할 계획입니다.
비슷한 다른 글을 알고 싶다면 GPT-4o: 가장 진보된 플래그쉽 AI 모델 발표 19 해당 카테고리를 방문하시면 됩니다블로그.
답글 남기기
관련 게시물