11월 27, 2024

Wpick

지상에서 한국의 최신 개발 상황을 파악하세요

Google 검색의 다음 단계: 컨텍스트가 왕입니다

Google 검색의 다음 단계: 컨텍스트가 왕입니다

오늘 Search On 이벤트에서 Google은 사람들이 검색 상자에 몇 단어를 입력하는 것 이상을 하도록 하는 가장 강력한 시도인 몇 가지 새로운 기능을 소개했습니다. MUM(Multitasking Unified Model)을 위한 새로운 기계 학습 기술을 작은 방식으로 활용함으로써 회사는 선순환을 시작하기를 희망합니다. 회사는 더 세부적이고 컨텍스트가 풍부한 답변을 제공하고 그 대가로 사용자가 더 자세한 정보와 컨텍스트를 묻기를 바랍니다. – 풍부한 질문. 회사는 최종 결과가 더 풍부하고 심층적인 검색 경험이 되기를 희망합니다.

Google 수석 부사장 Prabhakar Raghavan은 어시스턴트, 광고 및 기타 제품과 함께 검색을 감독합니다. 그는 말하기를 좋아하며 지난 일요일 인터뷰에서 “연구는 해결된 문제가 아닙니다”라고 반복했습니다. 그것이 사실일 수도 있지만, 그와 그의 팀이 지금 해결하려고 하는 문제는 웹에서의 말다툼이 아니라 웹에서 찾은 내용에 컨텍스트를 추가하는 것입니다.

Google은 기계 학습 사용과 관련된 주제 그룹을 인식하고 이를 조직적인 방식으로 제공하는 능력을 시연하기 시작할 것입니다. Google 검색의 향후 재설계에서는 다양한 하위 주제로 안내하는 “알아야 할 사항” 상자를 표시하기 시작할 것입니다. 전체 동영상이 아니더라도 일반적인 주제와 관련된 동영상 섹션이 있는 경우 해당 섹션으로 전송됩니다. 쇼핑 결과는 주변 상점에서 구할 수 있는 재고와 검색과 관련된 다양한 스타일의 옷을 표시하기 시작합니다.

“질문”이라는 용어가 더 나을지 모르지만 Google은 텍스트 상자를 넘어 검색할 수 있는 새로운 방법을 제공합니다. Google 렌즈 이미지 인식 소프트웨어를 더 많은 곳으로 옮기는 데 큰 힘을 쏟고 있습니다. iOS의 Google 앱과 데스크톱 기기의 Chrome 웹 브라우저에 포함될 예정입니다. Google은 MUM을 통해 사용자가 단순히 꽃이나 랜드마크를 식별하는 것 이상의 작업을 수행하는 대신 Lens를 사용하여 질문하고 쇼핑할 수 있기를 바랍니다.

Raghavan은 “이는 계속해서 확대될 것이라고 생각하는 주기입니다.”라고 말합니다. “더 많은 기술은 더 많은 사용자의 경제성으로 이어지고 더 나은 사용자 표현으로 이어지며 기술적으로 더 많은 사람이 필요합니다.”

Google 렌즈를 사용하면 이미지를 사용하여 검색하고 텍스트로 쿼리를 구체화할 수 있습니다.
이미지: 구글

검색 방정식의 이 두 가지 측면은 Google 검색의 다음 단계를 시작하기 위한 것입니다. 기계 학습 알고리즘은 정보를 직접 구성하고 표시함으로써 프로세스에서 더욱 두드러지게 됩니다. 그런 점에서 구글의 노력은 최근 인공지능 언어처리 기술의 발전에 큰 도움이 될 것이다. Large Language Models(MUM이 이러한 모델 중 하나임)로 알려진 시스템 덕분에 기계 학습은 단어와 주제 간의 연결을 매핑하는 데 훨씬 뛰어납니다. 회사가 연구를 보다 정확할 뿐만 아니라 탐색적이며 유용하게 만들기 위해 활용하는 기술입니다.

하나의 Google 예가 유용합니다. 자전거 부품의 이름에 대한 첫 번째 아이디어가 없을 수도 있지만 무언가가 고장난 경우 알아야 합니다. Google 렌즈는 변속기(뒷바퀴 근처에 매달려 있는 기어 변속 부품)를 시각적으로 식별할 수 있으며 별도의 정보를 제공하는 대신 해당 문제를 직접 수정하는 방법에 대해 질문하고 해당 정보로 이동합니다. (이 경우 우수) 유튜브 탑펌 채널).

더 많은 사용자가 Google 렌즈를 더 자주 열도록 하는 것은 그 자체로 훌륭하지만 더 큰 그림(말하자면)은 Google이 쿼리에 대해 더 많은 컨텍스트를 수집하려는 것입니다. Raghavan은 텍스트와 이미지를 결합하는 보다 복잡한 멀티미디어 검색에는 “제공자가 가져야 하는 완전히 다른 수준의 컨텍스트가 필요하므로 가능한 한 많은 컨텍스트를 얻는 데 엄청나게 도움이 됩니다”라고 말합니다.

우리는 Google이 제공하는 검색 결과의 소위 “10개의 파란색 링크”와는 거리가 멉니다. 정보 상자, 이미지 결과 및 직접 답변을 오랫동안 보여주고 있습니다. 오늘날의 광고는 Google이 제공하는 정보가 단순히 관련 정보의 레이블이 아니라 웹을 스크랩하여 기계가 이해하는 내용을 요약한 것이기 때문에 한 걸음 더 나아간 것입니다.

쇼핑과 같은 경우에 이러한 증류는 Google에 더 많은 페이지뷰를 보낼 가능성이 있음을 의미합니다. Lens와 마찬가지로 이러한 추세를 관찰하는 것이 중요합니다. Google 검색은 점점 더 Google 자체 제품으로 사용자를 끌어들이고 있습니다. 그러나 여기에도 더 큰 위험이 있습니다. 구글이 당신에게 더 많은 것을 알려준다는 사실은 당신이 항상 짊어져야 하는 부담을 직접적으로 증가시킨다.

즉, 나는 두 가지 다른 의미의 편견을 의미합니다. 첫 번째는 기술적인 것입니다. Google이 검색을 개선하기 위해 사용하려는 머신 러닝 모델에는 인종 및 성별 편견과 관련된 문서화된 문제가 있습니다. 그들은 웹의 많은 부분을 읽음으로써 훈련을 받았고, 결과적으로 그들은 말하는 방식이 좋지 않다는 것을 인식하는 경향이 있습니다. AI 윤리 팀과 관련된 Google의 문제는 이 시점에서 잘 문서화되어 있습니다. 2명의 고위 연구원 해고 그들이 바로 이 주제에 관한 논문을 발표한 후. Google 검색 담당 부사장인 Pandu Nayak은 다음과 같이 말했습니다. 모서리‘NS 오늘의 MUM 발표에 대한 그의 기사에서 James VincentGoogle은 모든 언어 모델에 편견이 있다는 것을 이해하지만 회사는 “직접 소비를 위해 사람들에게 공개”하는 것을 피할 수 있다고 믿습니다.

“알아야 할 사항”이라는 새로운 기능은 사용자가 검색과 관련된 주제를 탐색하는 데 도움이 됩니다.
이미지: 구글

그것이 무엇이든 (그리고 분명히 그렇지 않을 수도 있음) 다른 종속성 질문과 다른 종류의 편견을 피합니다. Google이 직접 정보 조합을 ​​더 많이 알려 주기 시작하면 어떤 관점에서 말씀하십니까? 저널리스트로서 우리는 소위 “아무도 없는 관점”이 어떻게 우리의 보도를 표현하는 부적절한 방법인지에 대해 이야기합니다. Google의 관점은 무엇입니까? 이는 회사가 과거에 겪었던 문제로, ‘단 하나의 진정한 답’ 문제로 불리기도 한다. Google이 자동화된 시스템으로 사람들에게 짧고 결정적인 답변을 제공하려고 할 때 종종 나쁜 정보 게시.

이 질문을 소개하면서 Raghavan은 현대 언어 패러다임의 복잡성을 지적함으로써 대답합니다. “거의 모든 언어 패러다임은 고차원 공간에서의 결혼식입니다. 이러한 공간의 특정 부분은 더 신뢰할 수 있는 경향이 있고 특정 부분은 덜 신뢰할 수 있는 경향이 있습니다. 우리는 이러한 것들을 기계적으로 아주 쉽게 평가할 수 있습니다. 문제는 , Raghavan은 말합니다.

그러나 진정한 대답은 적어도 현재로서는 Google이 Raghavan의 말에 따르면 “과도한 편집”으로 비난받을 수 있는 영역을 피함으로써 검색 엔진 관점의 문제에 직면하는 것을 피하기 위해 할 수 있는 일을 하고 있다는 것입니다. . 이러한 편견과 신뢰 문제에 대해 Google 경영진과 이야기할 때 종종 “신뢰성”과 같은 고차원 공간에서 쉽게 식별할 수 있는 부분에 중점을 둡니다.

예를 들어, 대변인은 구글이 “특정 규제 카테고리를 허용하거나 차단하지 않는다”고 말했지만 구글이 “특히 유해/민감한” 것으로 식별한 것을 누군가가 검색하면 구글의 새로운 “알아야 할 사항” 상자가 나타나지 않는다. 우리 시스템은 이러한 유형의 기능이 표시해야 하거나 표시하지 않아야 하는 주제를 이해할 수 있습니다.”

Google의 검색, 입력 및 출력, 알고리즘, 언어 모델은 상상할 수 없을 정도로 복잡해졌습니다. Google이 이제 비디오의 내용을 이해할 수 있다고 말할 때 이를 해낼 수 있는 계산 능력이 있다고 생각합니다. 그러나 진실은 그러한 거대한 컬렉션을 색인화하는 것조차 초기 웹 색인화의 원래 작업을 왜소화하는 거대한 작업이라는 것입니다. (Google은 기록을 위해 YouTube의 하위 집합에 대한 오디오 스크립트만 인덱싱하지만 MUM을 사용하면 미래에 시각적 인덱싱 및 기타 비디오 플랫폼을 목표로 합니다.)

종종 컴퓨터 과학자들과 이야기할 때, 행상인 문제 나타날거야. 주어진 수의 도시 사이에서 가능한 최단 경로를 계산하려고 하는 유명한 퍼즐이지만 컴퓨터가 기계를 작동하는 방식에 대해 생각하기 위한 풍부한 은유이기도 합니다.

“당신이 세상의 모든 기계를 저에게 준다면, 저는 꽤 큰 사건을 해결할 수 있습니다.”라고 Raghavan은 말합니다. 그러나 연구에 관해서는, 그는 그것이 해결되지 않았으며 아마도 더 많은 컴퓨터가 그에게 던져지면 해결될 수 없을 것이라고 말했습니다. 대신 Google은 Google이 현실적으로 만들 수 있는 리소스를 더 잘 활용하는 MUM과 같은 새로운 접근 방식을 고안해야 합니다. “만약 당신이 나에게 거기 있는 모든 기계를 준다면, 나는 여전히 인간의 호기심과 나의 인식에 의해 제한을 받을 것입니다.”

정보를 이해하는 Google의 새로운 방법은 인상적이지만 문제는 정보로 무엇을 할 것이며 어떻게 제시할 것인가입니다. 여행하는 세일즈맨 문제에 대한 재미있는 점은 아무도 멈춰서 정확히 무엇이 케이스인지 묻지 않는다는 것입니다. 그가 집집을 방문할 때 모든 고객에게 무엇을 보여주고 있습니까?