메뉴
BL
The Decoder 1시간 전

AI가 본 요리 레시피와 분자 데이터의 차이

IMP
6/10
핵심 요약

AI 스타트업 Kaikaku.AI는 동일한 구조의 AI 모델을 각기 다른 데이터(레시피, 화학 성분, 혼합)로 학습시켜 식재료 추천 결과를 비교하는 'Epicure' 연구를 발표했습니다. 이 모델은 다국어 코퍼스를 기반으로 문화권과 풍미에 따른 차이를 정밀하게 분석하며, 로봇 식당 운영에 이를 적용할 계획입니다.

번역된 본문

AI에게 닭고기와 잘 어울리는 식재료를 물어보면, 그 대답은 AI가 레시피로 학습했는지 분자 구조로 학습했는지에 따라 달라집니다. 조나단 켐퍼(Jonathan Kemper)의 2026년 5월 31일 블로그 포스트(Nano Banana Pro, THE DECODER 제공)에 따르면, 어떤 재료가 다른 재료와 어울리는지에 대한 대답은 레시피 기반의 짝꿍을 찾는지, 풍미가 비슷한 친척을 찾는지에 따라 다릅니다. 기존 AI 모델들은 이 두 가지를 혼합하여 다루었으나, 스타트업 Kaikaku.AI는 새로운 연구에서 두 관점을 분리했습니다.

야쿠브 라지코우스키(Jakub Radzikowski)와 조셉 첸(Josef Chen)이 발표한 'Epicure'는 구조가 거의 동일한 세 가지 AI 모델을 선보입니다. 이들은 오직 학습 데이터만 다릅니다. 첫 번째 모델인 'Cooc'은 실제 레시피에서 어떤 재료들이 함께 등장하는지만을 학습합니다. 두 번째 모델인 'Chem'은 FlavorDB 화학 데이터베이스를 활용해 재료들이 어떤 풍미 분자를 공유하는지만을 학습합니다. 세 번째 모델인 'Core'는 두 가지를 모두 혼합합니다.

이러한 차이는 구체적인 질의에서 명확히 나타납니다. '닭고기(chicken)'를 입력하면 Cooc은 레시피에 자주 등장하는 마늘, 양파, 후추를 반환합니다. 반면 Chem은 비슷한 풍미 프로필을 가진 소고기나 돼지고기를 반환합니다. '바질(basil)'을 입력하면 Cooc은 전형적인 파스타 재료인 파슬리, 올리브 오일, 파마산 치즈를 제안하지만, Chem은 허브 친척인 오레가노, 타라곤, 로즈마리를 제안합니다.

연구진에 따르면, 화학적 데이터로 학습한 모델은 정보가 없어야 할 영역에서 더 나은 성능을 보입니다. 달콤함, 신맛, 쓴맛 같은 풍미나 단백질, 지방 함량 같은 영양 가치는 학습 데이터에 직접적으로 코딩되어 있지 않습니다. 그럼에도 불구하고 Chem은 다른 변형 모델들보다 이러한 축을 따라 재료를 더 명확하게 분류합니다. 화학적 관계가 일종의 지름길 역할을 하여 다른 요리 개념에도 모델을 미세 조정하는 것으로 보입니다.

기존 공개된 재료 모델 중 가장 완성도 높았던 FlavorGraph는 영어권 레시피 코퍼스를 기반으로 구축되었습니다. 반면 Epicure는 7개 언어로 된 11개 출처에서 수집한 414만 개의 레시피를 처리합니다. 여기에는 중국어, 러시아어, 베트남어, 터키어, 인도네시아어, 독일어가 포함됩니다. Claude와 Gemini 임베딩으로 구축된 파이프라인은 맞춤법 변형, 브랜드 이름, 조리 지침 등 약 20만 개의 원시 용어를 번역하고 정리하여 1,790개의 깔끔한 식재료 데이터로 변환합니다.

다만 코퍼스 분포는 균일하지 않습니다. 자료의 약 절반이 동아시아 출처에서 나왔으며, 라틴 아메리카, 동유럽, 남아시아 요리는 각각 한 자릿수 비율만 차지합니다. 재료 중 약 1/3만이 화학 데이터베이스에 직접 연결되며, 나머지는 관련 재료를 통해 간접적으로 화학적 신호를 얻습니다.

완성된 모델은 두 가지 작동 모드로 실행됩니다. 첫 번째는 주어진 재료와 가장 가까운 재료를 찾는 단순 이웃 검색입니다. 두 번째는 사용자가 시드(seed) 재료를 조절 가능한 각도로 목표 방향으로 이동시키는 것입니다. 0도에서는 원본이 그대로 유지되고, 60도에서는 목표 이웃이 결과를 지배합니다. '쌀'을 남아시아 방향으로 약간 돌리면 카레 잎, 우라드 달, 차나 달, 페누그릭 시드가 나타납니다. '닭고기'를 서양 대서양 가공 식문화 방향으로 돌리면 크림 오브 치킨 수프, 초승달 모양 롤, 랜치 드레싱 같은 전형적인 미국 가정 요리 필수품이 나옵니다.

모델의 선택은 답변이 어느 문화권에서 나오는지도 결정할 수 있습니다. '초콜릿'을 '달콤한 페이스트리' 방향으로 돌리면 Cooc과 Core는 코코아, 바닐라, 베이킹 파우더 같은 서양 제과 재료를 반환합니다. 반면 Chem은 팥앙금, 말차 가루, 보랏빛 고구마가 포함된 동아시아 디저트 군집을 반환합니다. 즉, 모델의 선택이 답변의 문화적 배경을 결정합니다.

이 연구 뒤에는 레스토랑 기술 스타트업이 있습니다. 카이카쿠(Kaikaku)는 2023년 런던에서 설립되어 브런즈윅 센터에 자체 로봇 레스토랑인 'Common Room'을 운영하고 있으며, 이를 체인으로 확장할 계획입니다. 이 회사는 자체 머신러닝 시스템을 사용하여 재료를 무게를 달고 일정량을 배분합니다. '퓨전(Fusion)'이라는 이 기계는 이론상 360가지 재료를 제공할 수 있습니다.

원문 보기
원문 보기 (영어)
Ask AI what goes with chicken and the answer depends on whether it learned from recipes or molecules Jonathan Kemper View the LinkedIn Profile of Jonathan Kemper May 31, 2026 Nano Banana Pro prompted by THE DECODER What goes with an ingredient? The answer depends on whether you're looking for a recipe companion or a flavor relative. Previous AI models have mixed the two. The startup Kaikaku.AI separates both perspectives in new research. With "Epicure," Jakub Radzikowski and Josef Chen present three nearly identical AI models. They differ only in training data. The first model, "Cooc," only sees which ingredients appear together in real recipes. The second, "Chem," only sees which flavor molecules the ingredients share, drawing on the FlavorDB chemistry database. The third, "Core," blends both. Same question, three answers The difference shows up in specific queries. Type in "chicken," and Cooc returns garlic, onion, and black pepper, ingredients that frequently appear alongside it in recipes. Chem returns beef or pork, ingredients with a similar flavor profile. For "basil," Cooc serves up parsley, olive oil, and parmesan, the typical pasta pantry lineup. Chem serves up oregano, tarragon, and rosemary, the herb relatives. The chemistry-driven model also performs better in areas where it shouldn't have any information, according to the authors. Flavors like sweet, sour, or bitter and nutritional values like protein or fat content aren't directly coded in the training data. Yet Chem classifies ingredients along these axes more clearly than the other variants. The chemical relationships apparently act as a shortcut that also tunes the model to other culinary concepts. Multilingual corpus instead of English-heavy data The most complete public ingredient model to date, FlavorGraph, is built on an English-language recipe corpus. Epicure, by contrast, processes 4.14 million recipes from eleven sources in seven languages. These include Chinese, Russian, Vietnamese, Turkish, Indonesian, and German. A pipeline built on Claude and Gemini embeddings translates and cleans up about 200,000 raw terms, such as spelling variants, brand names, and preparation instructions, into 1,790 clean ingredients. The corpus remains unevenly distributed, though. About half the material comes from East Asian sources, while Latin American, Eastern European, and South Asian cuisines each contribute single-digit percentages. Only about a third of the ingredients are directly anchored in the chemical database. The rest pick up the chemical signal indirectly through related ingredients. A dial for direction Two modes of operation run on the finished model. The first is a simple neighbor search: which ingredients are closest to a given one? The second lets users shift a seed ingredient by an adjustable angle toward a target direction. At zero degrees, the original stays untouched. At sixty degrees, the target neighborhood takes over. Turn "rice" slightly toward South Asia, and curry leaf, urad dal, chana dal, and fenugreek seeds appear. Turn "chicken" more toward processed Western Atlantic cuisine, and you get Cream of chicken soup, crescent rolls, and ranch dressing, typical US home cooking staples. The model choice can even decide which culture an answer comes from. Turn "chocolate" in the direction of "sweet pastries," and Cooc and Core land on Western baking ingredients like cocoa, vanilla, and baking powder. Chem lands on an East Asian dessert cluster with red bean paste, matcha powder, and purple sweet potato. The choice of model also determines the cultural home of the answer. Authors are building robot restaurants Behind the research is a restaurant tech startup. Kaikaku was founded in London in 2023 and runs its own robotic restaurant, Common Room, in the Brunswick Centre , with plans to expand it into a chain. The company uses its own machine learning systems to weigh and portion ingredients . Its machine, called "Fusion," can theoretically dispense 360 bowls per hour. The system also includes ML-powered inventory management and 3D-printed food-safe components . The company raised about $1.8 million in a pre-seed round in 2024. Given that background, the interest in a machine-readable map of the ingredient world makes sense. A model that switches between recipe companions and flavor relatives on demand, translates ingredients across cuisines, or shifts them along axes like "fatty" or "fermented" would be useful in several places. It could help with menu development at a bowl restaurant, suggest replacements during supply shortages, or assist when scaling to new locations. Whether this works in practice remains to be seen. Model weights and datasets are now available on Hugging Face , making independent verification possible in principle. But the examples shown in the paper are hand-picked. In sparsely represented regions like South Asia or Latin America, the answers are likely far less stable than for the dominant East Asian and Western cuisines. The vocabulary cleanup also depends on the output of language models, which carry their own cultural biases. The fact that chocolate ends up near matcha in one model variant's "sweet pastry" direction is a nice effect. But it says little about how reliably such rotations work beyond the cherry-picked examples. Co-author Josef Chen promotes the model on X as "the largest multilingual food model ever built," saying they've got "all of human cooking compressed into 2 megabytes." An older version of the model is available as a demo at epicure.kaikaku.ai . AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now --> Read on for the full picture. Subscribe for hype-free coverage. Access to all THE DECODER articles. Read without distractions – no Google ads. Access to comments and community discussions. Weekly AI newsletter. 6 times a year: “AI Radar” – deep dives on key AI topics. Up to 25 % off on KI Pro online events. Access to our full ten-year archive. Get the latest AI news from The Decoder. Subscribe to The Decoder -->