Google은 ChatGPT를 추적하면서 'Gemini' AI로 Bard Chatbot을 업데이트합니다.

Google은 샌프란시스코 AI 스타트업 OpenAI가 제공하는 놀라운 챗봇인 ChatGPT에 필적할 수 있는 기술을 구축하기 위해 1년 넘게 경쟁해 왔습니다.

수요일, 거대 기술 기업은 자사의 챗봇인 Google Bard의 새로운 버전을 출시하면서 진행 중인 경쟁에서 한 단계 더 나아갔습니다. 업데이트된 봇은 미국을 포함한 170개 이상의 지역 및 국가에서 영어 사용자에게 즉시 제공될 예정이며, 회사가 올해 초부터 개발해 온 Gemini라는 새로운 AI 기술을 기반으로 합니다.

순다르 피차이 구글 CEO는 인터뷰에서 “이제 쌍둥이자리 시대의 시작이다”라고 말했다. “이것은 회사의 인공 지능 연구소인 Google DeepMind를 만들 때 가졌던 비전의 실현입니다. Google은 앞으로 몇 달 안에 다양한 제품과 서비스에 세 가지 다른 버전의 기술을 출시할 것입니다.”라고 그는 말했습니다.

Google DeepMind를 감독하는 Pichai와 Demis Hassabis는 Gemini가 Google의 이전 챗봇 기술보다 더 강력하며 더 정확한 응답을 생성하고 일부 상황에서 인간의 추론을 모방하는 데 더 가까워질 수 있다고 말했습니다.

Hassabis 박사는 “Gemini의 성과에 매우 만족합니다.”라고 말했습니다.

작년 말 OpenAI가 AI 기반 ChatGPT 챗봇으로 세상을 놀라게 했을 때 Google은 깜짝 놀랐습니다. 거대 기술 기업은 유사한 기술을 개발하는 데 수년을 보냈지만 다른 거대 기술 기업, 특히 Meta와 마찬가지로 편향되거나 거짓이거나 유해한 정보를 생성할 수 있는 기술 출시를 꺼려왔습니다.

지난 3월 Google은 평균 리뷰를 위해 챗봇인 Bard를 출시했습니다. 한 달 후, 회사는 Google Brain과 DeepMind라는 두 개의 인공 지능 연구소를 합병하여 2,000명 이상의 연구원과 엔지니어를 모았다고 발표했습니다. 그리고 지난 5월 획기적인 Google I/O 컨퍼런스에서 Google의 새로운 DeepMind 연구소가 Gemini 개발을 시작했다고 발표했습니다.

Google은 2011년 Brain Lab을 설립한 후 2014년 DeepMind를 인수하여 런던 AI 스타트업에 6억 5천만 달러를 지불했습니다. DeepMind는 지난 10년 동안 Brain Lab 및 나머지 Google 계열사와 거의 독립적으로 운영되어 왔으며 2017년에는 회사에서 퇴출을 시도하기도 했습니다. 그러나 Google이 OpenAI를 따라잡기 위해 고군분투하자 Pichai 씨는 두 연구소를 Hassabis 박사 산하에 합병했습니다. 신경과학자 DeepMind를 공동 창립한 사람입니다.

Google은 가장 강력한 Gemini 버전이 여러 주요 영역에서 최신 OpenAI 기술인 GPT-4보다 성능이 뛰어나다고 주장하는 벤치마크 결과를 발표했습니다. 피차이는 이전 구글 기술보다 컴퓨터 코드 생성 능력이 뛰어나고 뉴스 기사와 기타 텍스트 문서를 더 정확하게 요약할 수 있다고 말했습니다.

Gemini는 또한 이미지와 사운드를 분석하도록 설계되었지만 이러한 기술은 나중에 Bard 챗봇에 통합되지 않습니다.

Google은 세 가지 다른 기술 세트를 갖춘 세 가지 버전의 Gemini를 구축했습니다. 가장 큰 울트라(Ultra)는 복잡한 작업을 처리하도록 설계되었으며 내년에 출시될 예정입니다. 중간 계층 제품인 Pro는 Bard 챗봇을 사용하여 수요일부터 여러 Google 서비스에 출시될 예정입니다. 더 작은 버전인 Nano는 수요일부터 오디오 녹음을 요약하고 WhatsApp에서 제안된 텍스트 답장을 제공하는 등 Pixel 8 Pro 스마트폰의 일부 기능을 강화할 것입니다.

Gemini는 과학자들이 대규모 언어 모델(LLM)이라고 부르는 것으로, 디지털 서적, Wikipedia 기사 및 온라인 게시판을 포함하여 막대한 양의 데이터를 분석하여 기술을 학습할 수 있는 복잡한 수학 시스템입니다. 이 모든 텍스트의 패턴을 식별함으로써 LLM은 자체적으로 텍스트를 만드는 방법을 배웁니다. 이는 그가 연구 논문을 작성하고, 컴퓨터 코드를 작성하고, 심지어 대화를 계속할 수도 있다는 것을 의미합니다.

Google은 Gemini를 통해 디지털 이미지와 사운드에 대한 기술도 교육했습니다. 이것이 연구자들이 “다중 모드” 시스템이라고 부르는 것인데, 이는 이미지와 사운드를 분석하고 이에 반응할 수 있다는 의미입니다. 예를 들어 선, 모양, 기타 이미지가 포함된 수학 문제를 주면 그도 고등학생과 같은 방식으로 대답할 수 있습니다.

그러나 이 기술은 내년까지는 소비자에게 제공되지 않을 것입니다. Google은 또한 유사한 시스템과 마찬가지로 Gemini도 오류에 취약하다는 점을 인정했습니다. 잘못된 사실을 알거나 “환각”을 느낄 수도 있습니다.

다른 기업에 AI 및 컴퓨팅 서비스를 제공하는 Google Cloud는 OpenAI 및 Microsoft와 거래를 위해 경쟁하면서 고객에게 Gemini를 제공하기 위해 노력해 왔습니다. OpenAI가 지난 달 CEO인 Sam Altman을 잠시 사임하도록 강요하여 회사를 곤경에 빠뜨린 후 Google Cloud는 경쟁사의 고객을 빼앗기 위한 시도로 마이그레이션 계획을 세웠습니다.

고객은 현재 OpenAI 가격과 동일한 가격을 Google에 지불하고 클라우드 크레딧이나 할인을 받을 수 있습니다.

구글은 클라우드 고객이 12월 13일 중간 계층 제품인 Gemini Pro에 액세스할 수 있을 것이라고 밝혔습니다. Pichai는 현재 일부 낯선 사람들이 이 기술의 가장 강력한 버전인 Gemini Ultra를 테스트하고 있다고 말했습니다.

Google은 지난 1년 동안 OpenAI로부터 AI 리더십을 되찾기 위해 노력했지만 Pichai 씨는 시장에 모든 AI 제공업체를 위한 충분한 공간이 있다고 말했습니다.

피차이는 “이것은 제로섬 게임과는 거리가 멀다”고 말했다. “우리는 우리가 출시할 제품에 대해 기대감을 갖고 있습니다. 또한 후속 조치에서 우리가 만들고 있는 진행 상황을 볼 수 있기 때문에 아직 초기 단계라는 것을 알고 있습니다.