11월 19, 2024

Wpick

지상에서 한국의 최신 개발 상황을 파악하세요

Gemini 1.5: Google의 차세대 AI 모델이 거의 준비되었습니다

Gemini 1.5: Google의 차세대 AI 모델이 거의 준비되었습니다

구글이 AI 업계의 정상에 오르기를 희망하는 대형 언어 모델인 제미니(Gemini)를 출시한 지 불과 두 달 만에 회사는 이미 후속 모델을 발표했다. Google은 오늘 Gemini 1.5를 출시하고 곧 전체 소비자 출시에 앞서 개발자와 기업 사용자에게 제공할 예정입니다. 회사는 Gemini가 비즈니스 도구, 개인 비서 및 그 사이의 모든 역할을 담당한다는 점을 분명히 밝혔으며 해당 계획을 열심히 추진하고 있습니다.

Gemini 1.5에는 많은 개선이 이루어졌습니다. Google 생태계의 범용 모델인 Gemini 1.5 Pro는 Google이 최근 출시한 고급형 Gemini Ultra와 동등한 수준으로 보이며 Gemini 1.0을 능가했습니다. 프로는 87%. 참조 테스트에서. 이는 “전문가 혼합” 또는 MoE로 알려진 점점 더 인기 있는 기술을 사용하여 구축되었습니다. 즉, 쿼리를 제출할 때 전체 모델을 항상 처리하는 것이 아니라 전체 모델의 일부에서만 작동한다는 의미입니다. (여기에 대한 좋은 설명이 있습니다..) 이 접근 방식을 사용하면 양식을 더 빠르게 사용할 수 있고 Google이 더 효율적으로 실행할 수 있습니다.

그러나 Sundar Pichai CEO를 시작으로 회사 전체를 포괄하는 Gemini 1.5에는 특히 흥미로운 점이 하나 있습니다. Gemini 1.5에는 대규모 컨텍스트 창이 있어 훨씬 더 큰 쿼리를 처리하고 한 번에 더 많은 정보를 볼 수 있다는 의미입니다. 이 창은 OpenAI GPT-4의 경우 128,000자, 현재 Gemini Pro의 경우 32,000자에 비해 100만 자입니다. 토큰은 이해하기 어려운 측정항목입니다(여기에 좋은 분석이 있습니다.), 따라서 Pichai는 이를 더욱 간단하게 만듭니다. “약 10~11시간 분량의 비디오와 수만 줄의 코드입니다.” 컨텍스트 창은 AI 봇에게 이 모든 콘텐츠에 대해 한 번에 물어볼 수 있음을 의미합니다.

(Pichai는 또한 Google 연구원들이 천만 개의 토큰으로 구성된 상황별 창을 테스트하고 있다고 말합니다. 이는 전체 체인과 같습니다. 왕좌의 게임 한꺼번에.)

나에게 이것을 설명하면서 피차이는 당신이 다 맞출 수 있다는 멸시적인 말을 했습니다. 반지의 제왕 해당 컨텍스트 창에서 트리플입니다. 이것은 매우 구체적인 것 같아서 그에게 묻습니다. 이 일이 실제로 일어났습니다. 그렇죠? Google의 누군가는 Gemini가 연속성 오류를 발견했는지 확인하고 중간계의 복잡한 계보를 이해하려고 노력하며 AI가 마침내 Tom Bombadil을 이해할 수 있는지 확인하고 있습니다. “저는 이런 일이 일어났거나 일어날 것이라고 확신합니다. 둘 중 하나죠.” 피차이는 웃으며 말했습니다.

Pichai는 또한 더 큰 컨텍스트 창이 기업에 매우 유익할 것이라고 믿습니다. “이를 통해 쿼리 순간에 많은 컨텍스트와 개인 정보를 추가할 수 있는 사용 사례가 가능해졌습니다.”라고 그는 말합니다. “쿼리 창을 대폭 확장했으니 생각해 보세요.” 그는 영화 제작자가 전체 영화를 업로드하고 Gemini에게 평론가가 뭐라고 말할지 물어볼 것이라고 상상합니다. 그는 많은 양의 재무 기록을 검색하기 위해 Gemini를 사용하는 회사를 봅니다. “저는 이것이 우리의 가장 큰 성과 중 하나라고 생각합니다.”라고 그는 말합니다.

현재 Gemini 1.5는 Google의 Vertex AI 및 AI Studio를 통해 비즈니스 사용자와 개발자에게만 제공됩니다. 결국 모든 사람이 사용할 수 있는 Gemini Pro의 표준 버전인 Gemini 1.0을 대체하게 됩니다. Gemini.google.com 그리고 회사의 애플리케이션에서는 128,000개의 토큰을 포함하는 컨텍스트 창이 있는 버전 1.5 Pro가 될 것입니다. 100만개에 도달하려면 추가 금액을 지불해야 합니다. Google은 또한 특히 새롭게 확대된 컨텍스트 창과 관련하여 모델의 무결성과 윤리적 경계를 테스트하고 있습니다.

전 세계 기업들이 AI 전략을 파악하고 OpenAI, Google 또는 다른 업체와 개발자 계약을 체결할지 여부를 파악하려고 노력하는 가운데 Google은 현재 최고의 AI 도구를 구축하기 위해 치열한 경쟁을 벌이고 있습니다. 이번 주에 OpenAI는 ChatGPT를 위한 “메모리”를 발표했으며 웹 검색에서 이륙할 준비가 된 것으로 보입니다. 지금까지 Gemini는 특히 이미 Google 생태계에 참여하고 있는 사람들에게 인상적으로 보이지만 모든 측면에서 아직 해야 할 일이 많이 남아 있습니다.

결국 Pichai는 이 모든 1.0, 1.5, 플러스, 울트라 및 기업 전투가 사용자에게 실제로 중요하지 않을 것이라고 말했습니다. “사람들은 경험만을 소비할 것입니다.”라고 그는 말합니다. “항상 밑에 있는 프로세서에 주의를 기울이지 않고 스마트폰을 사용하는 것과 같습니다.” 그러나 현재 우리는 여전히 모든 사람이 자신의 전화기 안에 어떤 칩이 있는지 알 수 있는 시점에 있다고 그는 말합니다. 왜냐하면 그것이 중요하기 때문입니다. “기본 기술은 매우 빠르게 변화하고 있습니다.”라고 그는 말합니다. “사람들이 걱정해요.”