이미지 생성

어도비, AI로 사진을 평가하고 편집 제안하는 카메라 앱 기능 추가

어도비가 실험적인 iOS 카메라 앱인 '프로젝트 인디고(Project Indigo)'에 사진을 평가하고 편집 방향을 제안하는 새로운 AI 기능을 추가했습니다. 이번 업데이트에는 복잡한 프롬프트 입력 없이도 원터치로 작동하는 고급 사물 제거, 인공 심도 효과, 스타일 변환 기능 등이 포함되어 사진의 디테일을 높이는 데 유용합니다. 현재 'AI 플레이그라운드' 탭에서 테스트 중이며, 구글 제미나이(Gemini) 기반 모델이 탑재되었습니다.

어도비 AI카메라 이미지편집

Hacker News • 13일 전

우리는 디자인에 AI를 사용하지 않습니다

한 타이포그래피 디자이너가 생성형 AI가 디자인 과정을 대체하는 것에 대한 강력한 반대 의견을 제시합니다. 글자는 수천 년간 이어져 온 인간의 역사와 문화의 산물인데, AI는 이를 단순히 과거 데이터의 재조합으로 전락시키며 인간의 창조적 마찰을 상실시킨다는 것입니다. 특히 소수 언어를 지원하는 타이포그래피 산업이 AI 부족으로 위기를 맞을 수 있다는 점을 강조하며 인간 중심의 디자인을 고수해야 한다고 역설합니다.

생성형AI 타이포그래피 디자인

The Decoder • 14일 전

구글 검색, 원하는 이미지가 없으면 AI로 생성해 제공

구글이 검색 결과 내 AI 오버뷰(AI Overviews)에 텍스트를 통한 이미지 생성 기능을 직접 추가했습니다. 웹에서 찾는 이미지가 없을 경우 즉시 AI로 생성할 수 있지만, 외부 웹사이트의 트래픽 감소가 불가피해졌습니다. 이는 구글 검색이 본격적인 AI 우선(AI-first) 환경으로 전환되고 있음을 보여줍니다.

구글검색 AI오버뷰 이미지생성

TechCrunch AI • 14일 전

구글 이미지, 발견 중심의 핀터레스트형 리디자인 공개

구글 이미지가 핀터레스트와 유사한 동적 갤러리 형태로 리디자인되며, 'For You' 맞춤 갤러리와 이미지 저장 기능을 통해 탐색 및 발견 중심의 경험을 제공합니다. 또한 검색 내 AI 오버뷰(AI Overviews)에 이미지 생성 기능을 직접 통합하여 사용자가 특정 이미지를 찾지 못했을 때 구글 생태계 내에서 AI로 시각화할 수 있도록 지원합니다. 이는 사용자의 플랫폼 체류 시간을 늘려 광고 수익을 증대하고, 외부 AI 서비스 이탈을 막으려는 구글의 전략입니다.

구글 이미지생성 AI오버뷰

Google AI Blog • 14일 전

구글 이미지 25주년, 새로운 비주얼 서치 및 AI 이미지 생성 기능 도입

구글이 이미지 검색 서비스 출시 25주년을 맞아, 사용자의 관심사 기반 맞춤형 이미지 갤러리와 검색 내 AI 오버뷰(AI Overviews)를 통한 AI 이미지 생성 기능을 새롭게 선보입니다. 특히 최신 '나노 바나나(Nano Banana)' 모델을 적용해 텍스트 프롬프트만으로 고품질 이미지를 생성할 수 있게 되어, 검색 경험의 혁신이 기대됩니다. 이는 그동안 텍스트 중심이었던 검색 환경이 시각적 탐색 및 생성형 AI를 통해 직관적인 정보 전달 및 제작이 가능한 단계로 진화했음을 시사합니다.

구글 비주얼 검색 이미지 생성

404 Media • 15일 전

독자들이 보내준 역대 최악의 AI 포스터 모음

404 Media 기자가 독자들에게 'ChatGPT 포스터(전단지)' 사례를 공유해달라고 요청한 후, 끔찍하고 황당한 AI 생성 광고물 사례가 쏟아졌습니다. 실생활 곳곳에 무분별하게 사용된 저품질의 AI 이미지에 대한 대중의 강한 거부감과 불만이 확인된 사안입니다.

이미지 생성 챗gpt 이메일 마케팅

Wired AI • 19일 전

새로운 체험형 갤러리가 AI 예술에 대한 인식을 바꿀 수도 있는 이유

세계 최초의 AI 미술관인 '데이터랜드(Dataland)'가 LA에 오픈하여, 기존의 단순한 프롬프트 기반 생성 AI를 넘어선 새로운 예술적 가능성을 제시합니다. 아티스트 레핀 아나돌은 스미소니언 등의 데이터를 기반으로 자체 거대 자연 모델(Large Nature Model)을 학습시키고, 관람객의 생체 데이터를 반영한 몰입형 설치 작품을 선보였습니다. 이는 기존 빅테크 기업들이 직면한 저작권 및 윤리적 논란에서 벗어나, 윤리적이고 지속 가능한 방식의 AI 예술 패러다임을 제시한다는 점에서 중요합니다.

AI 예술 생성형 AI 데이터랜드

The Decoder • 20일 전

메타 '뮤즈 이미지' 기술적 호평, 인스타 사진 무단 활용 논란

메타가 자율적으로 코드를 작성하고 웹 검색을 수행하는 에이전트 기반의 첫 이미지 생성 모델인 '뮤즈 이미지(Muse Image)'를 공개했습니다. 이 모델은 우수한 성능을 인정받아 이미지 아레나 평가에서 오픈AI 모델 다음으로 2위를 차지했습니다. 그러나 사용자가 다른 사람의 인스타그램 아이디만 입력하면 동의 없이 해당 인물의 사진을 학습해 새 이미지를 생성하는 기능이 추가되어, 유럽 연합(EU) 등에서 심각한 프라이버시 및 GDPR 위반 논란이 예상됩니다.

메타 AI 에이전트 이미지 생성

TechCrunch AI • 21일 전

메타, 새로운 AI 이미지 생성기 '뮤즈' 출시

메타가 전담 AI 조직인 메타 슈퍼인텔리전스 랩스를 통해 새로운 AI 이미지 생성기 '뮤즈 이미지(Muse Image)'를 무료로 출시했습니다. 이 도구는 메타 AI 앱, 인스타그램 스토리, 왓츠앱 등에서 사용 가능하며, 프롬프트 기반 이미지 생성 및 편집, 인테리어 아이디어 시각화 등의 기능을 제공합니다. 메타는 향후 AI 비디오 생성기인 '뮤즈 비디오'도 개발 중임을 밝혔습니다.

메타 AI이미지생성 뮤즈

Wired AI • 21일 전

인스타그램 사진, 동의 없이 AI 이미지로 무단 사용됩니다

메타가 새로운 AI 이미지 생성 모델을 발표하며, 공개 계정의 인스타그램 사진을 기본적으로 다른 사용자의 AI 프롬프트에 활용할 수 있도록 기능을 도입했습니다. 개인정보 침해 우려가 크지만, 계정을 비공개로 전환하거나 설정에서 수동으로 '공유 및 재사용(Sharing and reuse)' 옵션을 꺼야만 이를 방지할 수 있습니다. 사용자에게 별도의 알림조차 가지 않는 이 기능은 즉각적인 설정 변경이 필요한 핵심 이슈입니다.

메타 인스타그램 AI 이미지 생성

TechCrunch AI • 28일 전

구글, 더 빠르고 저렴한 이미지 생성 모델 '나노 바나나 2 라이트' 공개

구글이 이미지 1,000장당 0.034달러라는 저렴한 비용으로 4초 만에 고품질 이미지를 생성하는 신모델 '나노 바나나 2 라이트(Nano Banana 2 Lite)'를 공개했습니다. 대량의 이미지 생성 및 반복 작업이 필요한 실무자와 개발자들에게 빠르고 경제적인 작업 환경을 제공한다는 점에서 중요합니다. 이와 함께 동영상 생성 모델 '제미나이 옴니 플래시(Gemini Omni Flash)'의 광범위한 배포와 정적 이미지를 영상으로 변환하는 데모 앱도 함께 발표되었습니다.

구글 이미지생성 AI모델

The Decoder • 28일 전

구글, 초고속 이미지 AI '나노 바나나 2 라이트' 및 비디오 생성 API 공개

구글이 1K 해상도 이미지를 4초 만에 생성하는 '나노 바나나 2 라이트'와 텍스트 명령어로 최대 10초 분량의 비디오를 생성 및 편집할 수 있는 '제미나이 오엠니 플래시' API를 출시했습니다. 개발자들은 비용 효율이 뛰어난 이 두 모델을 연속으로 연결(chaining)하여, 먼저 이미지를 빠르게 생성한 뒤 이를 비디오로 자연스럽게 애니메이션화하는 워크플로우를 구축할 수 있습니다.

구글 이미지 생성 비디오 생성

404 Media • 28일 전

실재하지 않는 AI 생성 희귀 꽃 씨앗 판매 사기 급증

AI 이미지 생성 기술이 악용되어 실제로는 존재하지 않는 화려하고 기괴한 형태의 식물 씨앗을 판매하는 사기가 e커머스 플랫폼에서 크게 성행하고 있습니다. 사기꾼들은 AI가 만들어낸 허구의 이미지로 소비자를 현혹하여, 실제로는 잡초나 무관한 씨앗을 무더기로 판매하며 막대한 부당 이익을 취하고 있습니다. 이는 AI 기술이 콘텐츠의 신뢰성을 훼손하고 실질적인 경제적 피해를 유발하는 대표적인 사례로, 온라인 쇼핑 플랫폼의 규제 및 대응이 시급함을 보여줍니다.

딥페이크 이커머스 사기 이미지 생성 AI

TechCrunch AI • 29일 전

구글 제미나이, 개인화 AI 이미지 생성 기능 미국 무료 개방

구글이 제미나이 앱의 개인화 AI 이미지 생성 기능을 미국의 모든 사용자에게 무료로 개방했습니다. 이 기능은 사용자의 구글 계정 데이터를 활용해 별도의 프롬프트 없이도 취향에 맞는 이미지를 자동으로 생성하는 것이 특징입니다. 이로써 기존 유료 구독자 전용이던 고급형(Personal Intelligence) 기능이 일반 사용자에게도 확대 제공되게 되었습니다.

제미나이 구글 이미지생성

Hacker News • 33일 전

AI가 쓴 동화책, 바디 호러의 세계

저자는 아마존 베스트셀러인 AI 생성 어린이 백과사전을 직접 구매하여 분석했습니다. 그 결과, 최신 AI 모델로 제작되었음에도 불구하고 등장인물의 기괴한 일그러짐과 무서운 분위기 등 심각한 품질 문제를 발견했습니다. 이는 구매자(부모)와 독자(아이)가 다른 콘텐츠 시장의 특성상 빠르게 퍼지고 있으며, 검증되지 않은 AI 콘텐츠가 아동에게 미칠 악영향에 대한 경고로 작용합니다.

AI 윤리 콘텐츠 품질 이커머스

Hacker News • 35일 전

Krea 2 공개: 창의적 탐색을 강화한 12B 오픈웨이트 이미지 모델

Krea 2는 단순히 완성도 높은 기본 스타일을 넘어, 사용자가 다양한 미적 스타일과 분위기를 폭넓게 탐색할 수 있도록 설계된 120억 개 매개변수(12B) 규모의 최신 오픈웨이트 이미지 생성 모델입니다. 확산 트랜스포머(Diffusion Transformer, DiT) 아키텍처와 다단계 학습 파이프라인을 통해 표현력과 제어력을 극대화했으며, 관대한 라이선스로 가중치를 공개해 실무자들이 자유롭게 활용할 수 있다는 점에서 중요합니다.

krea2 오픈소스 이미지 생성

Hacker News • 36일 전

모에비우스: 100억 매개변수급 성능의 2천만 경량 이미지 인페인팅 모델

화중과학기술대학교 및 VIVO AI Lab 연구진이 발표한 'Moebius(모에비우스)'는 2,200만 개(0.22B)의 파라미터만으로 119억 개(11.9B) 파라미터 규모의 거대 산업용 모델(FLUX.1-Fill-Dev)과 맞먹거나 이를 뛰어넘는 이미지 인페인팅(이미지 채움/수정) 성능을 달성한 혁신적인 경량 모델입니다. 새로운 어텐션 블록 구조와 다중 해상도 증류(Knowledge Distillation) 기술을 결합하여, 기존 100억 규모 모델 대비 파라미터는 2% 미만으로 줄이면서도 추론 속도는 15배 이상 향상시켰습니다. 이는 일반 소비자용 GPU 및 엣지 디바이스에서도 고품질의 이미지 생성 및 편집이 가능함을 의미하며, AI 모델의 실사용성 및 효율성 측면에서 매우 중요한 연구로 평가받습니다.

이미지-인페인팅 경량-모델 지식-증류

Wired AI • 47일 전

애플 카메라 총괄 "AI, 일반인에게 슈퍼파워를 부여할 것"

애플은 경쟁사와 달리 사진의 진정성을 훼손하지 않는 범위 내에서 제한적으로 생성형 AI를 사진 앱에 도입합니다. 새로운 '확장(Extend)' 및 '공간 재구성(Spatial Reframe)' 기능은 배경의 가짜 픽셀을 생성해 구도 문제를 해결하지만, 주요 피사체의 얼굴이나 무한 확장 등은 제한합니다. 또한 AI 편집 흔적을 남기기 위해 구글의 SynthID 기반 보이지 않는 워터마크를 도입하는 등 사진의 진실성을 지키는 데 집중합니다.

애플 생성형 AI 사진 편집

TechCrunch AI • 50일 전

애플 이미지 플레이그라운드, 이제는 제 몫을 한다

애플이 WWDC 2026에서 기존보다 훨씬 향상된 AI 이미지 생성 도구인 '이미지 플레이그라운드(Image Playground)'를 발표했습니다. 자연어 프롬프트를 통해 사진을 다양한 스타일로 변환하고 원하는 비율로 이미지를 생성할 수 있게 되었으며, 앱은 기기 전반에 긴밀하게 통합됩니다. 특히 경쟁사와 달리 '프라이빗 클라우드 컴퓨트'를 통해 사용자의 개인 사진을 AI 학습이나 데이터 저장에 절대 사용하지 않는다는 점에서 프라이버시 측면의 큰 차별점을 강조했습니다.

애플 AI 이미지 생성 WWDC 2026

TechCrunch AI • 50일 전

애플 사진 앱, 애플 인텔리전스 기반 신규 AI 편집 기능 추가

애플은 WWDC 2026에서 애플 인텔리전스를 활용하는 새로운 사진 앱 AI 편집 기능들을 발표했습니다. 핵심 기능으로는 AI를 통해 사진의 구도와 원근감을 자연스럽게 재조정하는 '리프레임(Reframe)', 배경을 확장하는 '확장(Extend)', 그리고 생성형 AI로 방해 요소를 더욱 깔끔하게 지우는 '정리(Cleanup)' 도구의 업그레이드가 포함됩니다. 이번 업데이트는 사용자가 본래의 촬영 환경을 넘어 사진을 유연하게 보정하고 재구성할 수 있도록 지원한다는 점에서 중요합니다.

애플 애플 인텔리전스 이미지 생성

The Decoder • 50일 전

마이크로소프트 리서치 Lens 이미지 생성 모델

마이크로소프트 'Lens', 모델 크기보다 상세한 캡션의 중요성 입증

마이크로소프트 리서치는 적은 컴퓨팅 자원으로도 고성능을 발휘하는 텍스트-투-이미지(T2I) 생성 모델 'Lens'를 공개했습니다. GPT-4.1이 생성한 고품질의 상세한 이미지 설명(캡션)과 강력한 언어 인코더, 그리고 강화학습 및 추론(Reasoner) 모델을 결합하여 800억 파라미터급 거대 모델들을 무시하는 효율성을 입증했습니다. 이는 자원이 제한된 환경에서도 데이터 품질과 아키텍처 최적화만으로 최고 수준의 이미지 생성 모델을 만들 수 있음을 보여준다는 점에서 매우 중요합니다.

The Decoder • 55일 전

아이디오그램 4.0, 오픈웨이트로 공개

텍스트-투-이미지 모델인 아이디오그램 4.0이 오픈웨이트 모델로 전격 공개되었습니다. 이번 업데이트는 기본 2K 해상도, 투명한 배경, 정밀한 레이아웃 제어 기능 및 눈에 띄게 향상된 이미지 내 텍스트 렌더링을 제공하며, 사용자의 자체 하드웨어에서 구동 및 파인튜닝이 가능합니다. 특히 상업적 활용도가 높은 로고 및 포스터 제작 실무자들에게 매우 유용한 핵심 툴로 평가받고 있습니다.

이미지 생성 오픈소스 아이디오그램

TechCrunch AI • 56일 전

AI 이미지 생성 마틴 스코세이지 블랙 포레스트 랩스

마틴 스코세이지, 가장 뜻밖의 할리우드 AI 옹호자로 등장

마틴 스코세이지 감독이 AI 이미지 생성 스타트업 '블랙 포레스트 랩스(Black Forest Labs)'의 파트너 및 자문으로 합류했습니다. 스코세이지 감독은 해당 기술을 오직 영화 스토리보딩 목적으로만 사용하며, 자신의 비전을 제작진에게 더 빠르고 효율적으로 전달하는 데 도움을 받는다고 밝혔습니다. 이는 할리우드의 한때 거셌던 AI 반발이 점차 누그러지고 있음을 보여주는 가장 최신의 이정표가 되었습니다.

Hacker News • 58일 전

IMP 9

로컬 기기용 초경량 이미지 생성 모델

PrismML이 노트북과 스마트폰 같은 로컬 기기에서 고품질 이미지 생성을 가능하게 하는 40억 파라미터(4B) 모델 'Bonsai Image 4B'를 공개했습니다. 이 모델은 가중치를 1비트(1-bit) 또는 삼진법(Ternary) 형태로 압축하여, 기존 풀 정밀도(FP16) 모델 대비 메모리 사용량을 약 6~8배 획기적으로 줄였습니다. 특히 이 파라미터 클래스의 이미지 모델 중 최초로 아이폰에서 직접 구동될 수 있어, 온디바이스 AI 생성 기술의 새로운 지평을 열었다는 데 큰 의미가 있습니다.

온디바이스 AI 이미지 생성 모델 경량화

Hacker News • 59일 전

수작업으로 완성한 하와이 제도 지도

온라인에서 쉽게 찾아볼 수 없는 하와이 제도의 작은 환초와 암초까지 모두 담아낸 수작업 지도 제작 프로젝트입니다. 제작자는 수채화와 코픽 마커(Copic marker), 어도비 프레스코(Adobe Fresco)를 활용해 총 1,500마일에 달하는 하와이 전체 군도 지도와 8개 주요 섬을 상세히 표현한 두 가지 버전의 지도를 완성했습니다.

디지털 아트 크리에이티브 디자인

The Decoder • 62일 전

마이크로소프트 'MAI-Image-2.5' 구글 모델과 동급 성능 달성

마이크로소프트가 공개한 최신 이미지 생성 모델 'MAI-Image-2.5'는 텍스트 렌더링, 스타일화된 일러스트 등에서 대폭 향상된 성능을 보여주며 벤치마크에서 구글의 모델과 동급의 경쟁력을 입증했습니다. 특히 상업용 제품 사진이나 브랜드 디자인 등 실무적 사용 사례에 최적화된 것이 특징이며, 오픈AI의 최상위 모델에는 아직 한 발 뒤처진다고 평가받고 있습니다.

마이크로소프트 이미지 생성 인공지능 경쟁

r/ChatGPT • 63일 전

ChatGPT가 찍은 '실수로 찍힌 셀카'

한 사용자가 ChatGPT에게 주머니에서 휴대폰을 꺼내다 실수로 찍힌 듯한 일상적이고 서툰 셀카를 생성해 달라고 프롬프트를 입력했습니다. 이에 ChatGPT는 흔들림, 과노출, 어색한 앵글 등 평범한 스마트폰 실수 사진의 특징을 매우 사실적으로 반영한 이미지를 만들어냈습니다. 이는 사용자의 구체적이고 창의적인 지시를 AI 이미지 생성 모델이 얼마나 정교하게 이해하고 구현할 수 있는지를 보여주는 흥미로운 사례입니다.

chatgpt 이미지 생성 AI 셀카

r/LocalLLaMA • 63일 전

PrismML, 로컬 브라우저 구동 텍스트-이미지 모델 발표

PrismML팀이 1비트와 3진법 가중치를 활용한 텍스트-이미지 디퓨전 트랜스포머인 Binary 및 Ternary Bonsai Image 4B를 공개했습니다. 기존 FLUX.2 Klein 4B 모델(약 16GB)과 비교해 약 3GB 수준으로 크기를 획기적으로 줄이면서도 WebGPU를 통해 브라우저 내에서 완벽하게 로컬 구동이 가능합니다. Apache-2.0 라이선스로 제공되어 누구나 제한 없이 사용하고 변형할 수 있는 오픈소스 모델이라는 점이 가장 큰 의의입니다.

오픈소스 이미지 생성 로컬 구동

r/ChatGPT • 65일 전