지금 Google Imagen 3 AI 이미지 생성기를 사용해 보는 방법

Google의 최신 AI 이미지 생성 모델인 Imagen 3가 이제 미국에서 공개적으로 제공되며, 이를 시험해 보려면 무료 Google 계정만 있으면 됩니다. VentureBeat에서 발견한 내용회사는 이번 주에 조용히 모델을 공개하고 연구 결과를 발표했습니다. 화요일 신문에서이는 지난해 5월 구글 I/O 컨퍼런스에서 새 모델을 처음 발표한 지 두 달 만이다.

Hugging Face의 게시물에서Google 연구원들은 기계 학습 플랫폼 내에서 “우리는 텍스트 프롬프트에서 고품질 이미지를 생성하는 잠재 확산 모델인 Imagen 3를 제시합니다. 우리는 Imagen 3가 다른 상태보다 선호된다고 설명합니다. – the-art 모델(SOTA) 평가 당시 “이외에 안전성과 대표성에 관련된 문제와 모델에 대한 잠재적인 피해를 최소화하기 위해 어떤 방법을 사용했는지에 대해 논의합니다.”

전문가가 아닌 예비 테스트를 통해 본 모델은 매우 견고한 것으로 보입니다. 사실적인 이미지를 요청하면 결과는 상대적으로 높은 품질이며, 첫눈에 사람들을 속일 수 있는 사실주의에 대한 적절한 시도가 있습니다. (모델에게 35mm 필름 룩을 생성해 달라고 요청했을 때 이미지 품질에 특히 깊은 인상을 받았습니다.) Imagen 3는 또한 출력에 영향을 미치는 프롬프트의 특정 부분을 강조 표시하므로, 내용이 마음에 들지 않으면 편집할 수 있습니다. 이미지가 어떻게 나왔는지.

저작권: 제이크 피터슨/구글

그러나 Imagen 3는 AI 생성 이미지에 여전히 표시 태그를 표시합니다. 일부 이미지에서는 손이 너무 많이 나타나고, 얼굴이 왜곡되고, 텍스트가 이해되지 않습니다. (비록 해당 모델은 상표권을 침해하는 정확도로 “Coca-Cola” 및 “Canon” 로고를 재현할 수 있었지만)

저작권: 제이크 피터슨/구글

이번 주에 새로운 사진 모델을 출시하는 기술 회사는 Google만이 아닙니다. X는 최근 회사의 AI 챗봇인 Grok의 새로운 베타 버전을 출시했습니다. 매우 제한 사항이 거의 없습니다. 사용자(특히 Lifehacker의 Michelle Erhardt)는 Grok을 사용하여 MAGA 모자를 쓴 Taylor Swift부터 AK-47을 들고 있는 피카츄까지 모든 것을 생성했습니다.

반면 Imagen은 3개의 투명한 가드레일을 표시합니다. 논란의 여지가 있는 내용에 대해 Google Image Generator를 지시하려고 할 때마다, 내 지시가 부적절한 이유를 이해하기 위해 Imagen 3 FAQ 섹션으로 정중하게 안내합니다. 또한 이 프로그램은 저작권이 있는 콘텐츠 생성을 거부하지만 올바른 지시어를 사용하여 콘텐츠를 생성하도록 속일 수 있습니다. 위에서 언급했듯이 로고를 생성할 수 있었고, 총격전을 벌이지는 못하더라도 마리오, 피카츄와 같은 트레이드마크 캐릭터를 꺼내게 할 수 있었습니다.