유출된 제미나이 옴니 vs 곧 폐지되는 소라 2
최근 유출된 구글의 '제미나이 옴니(Gemini Omni)' 영상 생성 모델과 현재 API로만 제공되며 곧 완전히 폐지될 예정인 오픈AI의 '소라 2(Sora 2)'의 성능을 직접 비교한 글입니다. 작성자는 두 모델에 최대한 동일한 프롬프트를 입력하여 스파게티 식사 장면, 애니메이션 액션, 칠판 수식 증명 등의 영상을 생성했으며, 독자들에게 어느 모델의 결과물이 더 뛰어난지 평가를 요청하고 있습니다.
안녕 여러분,
유출된 제미나이 옴니(Gemini Omni) 영상 모델에 대한 관심이 뜨거운 가운데, 이 모델이 오픈AI의 소라 2(Sora 2)와 직접적으로 어떻게 비교되는지 확인해보고 싶었습니다.
소라 2에 대해 간단히 말씀드리자면, 현재 이용이 제한된 상태이며 API를 통해서만 사용할 수 있습니다. 그리고 가까운 미래에 완전히 서비스가 종료될 예정입니다. 저는 빙(Bing) 소라 2 영상 생성기를 사용하여 이 비교용 영상을 만들었습니다. 두 모델의 차이를 한눈에 쉽게 알아볼 수 있도록, 소라 2가 생성한 영상에는 일부러 AI 워터마크를 남겨두었습니다.
비교가 최대한 공정하게 이루어지도록, 제가 X(옛 트위터)에서 발견한 유출된 제미나이 옴니 영상의 프롬프트와 매우 유사하게 입력값을 구성했습니다.
다음은 원본 제미나이 옴니 영상의 출처입니다: https://x.com/i/status/2053824398503678108
https://x.com/i/status/2053718756799467735
https://x.com/i/status/2053857806374064496
다음은 영상에 등장하는 순서대로 제가 사용한 프롬프트입니다:
1. 스파게티 장면 "해변가 고급 레스토랑의 야외 데크 좌석에 둥근 테이블을 사이에 두고 앉아 있는 두 남자의 장면을 만들어 줘. 테이블에는 하얀색 고급 테이블보와 화려한 식기류, 포크, 나이프, 고급 냅탁, 중앙 장식품 등이 잘 갖춰져 있다. 한 남자는 품위가 있는 50대 흑인 남성으로 짧은 수염을 기르고 당당한 자세를 취하고 있으며 맞춤형 정장을 입고 있다. 다른 남자는 그의 친구이며, 두 사람 모두 테이블에 다가가 스파게티 접시를 먹으려 하고 있다."
2. 애니메이션 전투 "넓은 초원에서 해 질 녘에 벌어지는 활기찬 애니메이션 전투 장면. 푸른 불꽃 문양이 새겨진 흑발 소년이 묵직하게 서 있는 백발의 상대에게 강력한 펀치와 킥을 날리고, 역동적인 푸른 에너지 효과와 타격선(Impact lines)이 표현됨."
3. 칠판 수학 증명 "교수가 전통적인 칠판에 삼각함수 항등식에 대한 수학적 증명을 적어가며, 현재 풀고 있는 단계에 대해 설명하는 모습."
댓글로 어느 모델이 영상 생성을 더 잘해냈는지 여러분의 생각을 알려주세요!