메뉴
BL
404 Media 25일 전

AI 붐 야기한 하드드라이브 대란, 인터넷 아카이브 위기

IMP
8/10
핵심 요약

AI 데이터센터의 폭발적인 수요 증가로 인해 저장장치 가격이 급등하면서 인터넷 아카이브 및 위키피디아 같은 주요 디지털 아카이빙 프로젝트들이 심각한 자원 확보 문제에 직면했습니다. 주요 하드드라이브 제조사들은 기업용 고객 수요를 감당하기 위해 소비자 시장을 아예 포기하거나 향후 재고까지 이미 매진되는 등 공급망 전반이 대규모 AI 인프라로 쏠려 있습니다. 결과적으로 공익을 위한 데이터 보존 활동은 큰 타격을 받고 있으며, 비용 부담 증가와 필수 장비 확보의 어려움이라는 직접적인 위협에 처해 있습니다.

번역된 본문

AI 데이터센터 붐으로 인해 하드드라이브 및 스토리지 비용이 치솟으면서, 디지털 아카이브 관리자, 학계, 위키피디아, 그리고 취미로 데이터를 수집하는 사람들이 데이터를 저장하고 인터넷을 아카이빙하는 것이 더 비싸지고 어려워지고 있습니다. 아키이비스트들은 인터넷 아카이브(Internet Archive)와 같은 유명 기관이 선호하는 특정 드라이브가 훨씬 비싸지거나 아예 구하기조차 어려워졌다고 말했습니다.

지난 몇 달 동안 소비자용 및 기업용 솔리드 스테이트 드라이브(SSD), 하드드라이브 및 기타 유형의 스토리지 가격이 급등했습니다. 예를 들어, 작년 가을에 159달러에 구매했던 삼성 2TB 외장 SSD가 현재는 575달러에 판매되고 있습니다. 다양한 드라이브의 평균 가격을 추적하는 웹사이트 'PC Part Picker'에 따르면, 작년 10월경부터 스토리지 가격이 전반적으로 상승하기 시작했습니다. 이 사이트가 추적하는 많은 드라이브의 가격은 두 배로 뛰거나 150% 이상 인상되었으며, 일부 매장에서는 SSD와 하드드라이브가 품절되기도 했습니다. 현재 일부 SSD의 경우 중고 시장까지 생겨났으며, 사람들이 이베이(eBay) 등에서 웃돈을 받고 되팔고(Scalping) 있습니다.

인터넷 역사상 가장 중요한 아카이빙 프로젝트인 인터넷 아카이브와 웨이백 머신(Wayback Machine)의 설립자 브루스터 케일(Brewster Kahle)은 404 Media와의 인터뷰에서 치솟는 스토리지 비용이 "우리의 시간과 돈을 모두 소모하게 만드는 매우 현실적인 문제"라고 말했습니다. 케일은 "우리가 선호하는 28~30TB 드라이브는 아예 구할 수 없거나 매우 높은 가격에 판매되고 있다"며, "우리는 매일 100테라바이트 이상의 새로운 자료를 수집하며, 지속적인 업그레이드와 유지보수가 필요한 기기에 이미 210페타바이트 이상의 자료가 아카이브되어 있기 때문에 끊임없이 새로운 하드드라이브를 구해야 한다"고 덧붙였습니다.

그는 또한 "다행히 아카이브에 기부를 해주는 활발한 커뮤니티가 있으며, 우리는 이 어려운 시기에 하드드라이브 제조사들의 도움도 찾고 있다. 우리는 항상 더 많은 지원을 기다리고 있다"며, "지금까지는 이러한 품귀 현상을 우회할 방법이 있었지만, 이는 우리의 시간과 돈을 소모하게 만드는 매우 현실적인 문제다"라고 덧붙였습니다.

위키피디아와 로열티 없는 미디어 공개 저장소인 위키미디어 공용(Wikimedia Commons) 등 다양한 프로젝트를 운영하는 위키미디어 재단은 404 Media에 스토리지 비용이 재단의 프로젝트에도 우려 사항이 되었다고 밝혔다. 위키미디어 재단 대변인은 "위키피디아에만 6,500만 개 이상의 문서가 있는 만큼 서버 및 스토리지 용량에 대한 접근성은 우리에게 매우 중요하다. 우리는 2025년 말(역주: 원문 기재 연도) 이후 가격 상승을 확실히 목격했다. 업계의 다른 모든 참여자들과 마찬가지로 이러한 가격 인상은 우리에게 우려스러운 일이다. 우리는 메모리와 하드드라이브 구매에서 주된 영향을 보고 있지만, 서버 배송 리드 타임과 향후 주문 능력 측면에서도 영향을 미치고 있다"고 전했습니다.

"위키미디어 재단은 비영리 단체로서 예산 할당을 매우 신중하게 고려합니다. 우리는 전 세계 사용자에게 서비스를 제공하기 위해 자체 데이터센터를 유지하고 있습니다. 우리는 가능한 한 우회적인 해결책을 마련하고 있으며, 주로 하드웨어 투자 우선순위를 정하는 데 있어 현명하게 대처하고, 유연성을 구축하며, 가능한 한 기존 하드웨어의 수명을 연장하는 방식을 취하고 있습니다."

💡 폭등하는 SSD나 RAM 가격의 영향을 받으셨나요? 여러분의 제보를 기다립니다. 업무용 기기가 아닌 개인 기기를 이용해 Signal(jason.404)로 안전하게 메시지를 보내주시거나, jason@404media.co로 이메일을 보내주세요.

최대 규모의 하드드라이브 및 스토리지 시스템 제조업체 중 하나인 웨스턴디지털(Western Digital)은 데이터센터를 운영하는 기업 고객들을 대상으로 사실상 2026년 재고가 모두 매진되었다고 밝혔습니다. Crucial이라는 브랜드로 RAM과 SSD를 제조해 온 마이크론(Micron)은 "데이터센터의 AI 주도 성장으로 인해 메모리 및 스토리지에 대한 수요가 급증했다. 마이크론은 더 빠르게 성장하는 분야에서 더 크고 전략적인 고객을 위한 공급 및 지원을 개선하기 위해 Crucial 소비자 사업을 철수하는 어려운 결정을 내렸다"며 소비자 시장에서 완전히 철수했습니다.

결과적으로 AI 붐은 여러 모로 중요한 아카이빙 프로젝트에 해를 끼치고 있습니다. AI 기업들의 무차별적인...

원문 보기
원문 보기 (영어)
Skyrocketing hard drive and storage costs caused by the AI data center boom are making it more expensive and more difficult for digital archivists, academics, Wikipedia, and hobby data hoarders to save data and archive the internet. Specific drives favored by some high profile organizations like the Internet Archive have become far more expensive or are difficult to find at all, archivists said. Over the last several months, prices for both consumer level and enterprise solid state drives, hard drives, and other types of storage have skyrocketed. As an example, a 2TB external Samsung SSD I purchased last fall for $159 now costs $575. PC Part Picker, a website that tracks the average price of different types of drives, shows a universal increase in storage prices starting in about October of last year. Prices of many of the drives it tracks have doubled or increased by more than 150 percent, and at some stores SSDs and hard drives are simply sold out . There is now even a secondary market for some SSDs, with people scalping them on eBay and elsewhere. Brewster Kahle, founder of the Internet Archive and the Wayback Machine, the most important archiving projects in the history of the internet, told 404 Media that the skyrocketing costs of storage is “a very real issue costing us time and money.” “We have found that the preferred 28-30TB drives are just not available or at very high price,” Kahle said. “We gather over 100 terabytes of new materials each day, and we have over 210 Petabytes of materials already archived on machines that need continuous upgrades and maintenance, so we need to constantly get new hard drives.” “We are fortunate to have an active community that donates to the Archive, and we are also looking for help from hard drive manufacturers in these difficult times. We are always looking for more help,” he added. “So far we have ways to work around these shortages, but it is a very real issue causing us time and money.” The Wikimedia Foundation, which runs Wikipedia and various other projects, including Wikimedia Commons, an open repository of royalty free media, told 404 Media that the cost of storage has become a concern for the foundation’s projects as well. “With over 65 million articles on Wikipedia alone, access to server and storage capacity is vital to us. We’ve certainly seen price increases since the end of 2025.These price increases are of concern to us, as with every other player in the industry. We see the primary impact in the purchase of memory and hard drives but also in terms of lead times on server deliveries and our capacity to place future orders,” a Wikimedia Foundation spokesperson told us. “The Wikimedia Foundation is a non-profit, and as such how we allocate budget is very carefully considered . We maintain our own data centers to serve our users from all over the world. We’re putting workarounds in place where we can, mainly involving being smart with how we prioritize investment in hardware, building in flexibility as well as extending the life of existing hardware where possible.” 💡 Have you been affected by skyrocketing SSD or RAM prices? I would love to hear from you. Using a non-work device, you can message me securely on Signal at jason.404. Otherwise, send me an email at jason@404media.co. Western Digital , one of the largest manufacturers of hard drives and other storage systems, said that it has essentially sold out of its 2026 inventory to enterprise clients, many of which run data centers. Micron, which made RAM and SSDs under the brand name Crucial , has exited the consumer market altogether because “AI-driven growth in the data center has led to a surge in demand for memory and storage. Micron has made the difficult decision to exit the Crucial consumer business in order to improve supply and support for our larger, strategic customers in faster-growing segments.” The AI boom is thus harming critical archiving projects in multiple ways. As a reaction to AI companies indiscriminately scraping the entire internet to train their large language models, website owners have increasingly put up registration walls, blocked web scrapers by changing their robots.txt to disallow bots, and have otherwise attempted to stop bots from accessing their websites. Many of these websites have either accidentally or purposefully ended up blocking bots from the Internet Archive and other archiving projects. The Electronic Frontier Foundation suggested “blocking the Internet Archive won’t stop AI, but it will erase the web’s historical record.” Beyond that logistical challenge, archivists are now needing to make difficult decisions about how and what to archive because they are, in some cases, simply running out of storage. Mark Phillips, a University of North Texas professor who helps runs the End of Term Archive, which archives government websites between changes in presidential administrations, told 404 Media that he has had to consider the price of infrastructure recently: “When we went to refresh some of our servers, the costs of the RAM and SSDs for those machines were a dramatic increase and made us rethink some of the capacity we were hoping to go with,” he said. “We have not had to do any major storage purchases in the past six months, and I hope that by the time we do the market will have leveled out a bit.” The cost of storage has become a constant topic of discussion on Reddit’s r/DataHoarder community, where digital librarians and hobby archivists discuss different archiving setups; many posts are from people who say they have simply had to stop buying drives, have had to put their archiving plans on hold, or are looking to vent about the price of drives. Occasionally, there are posts from people who managed to find a large drive for a decent price on clearance or at a thrift store. Many of these posts are from people who say that they have essentially given up on archiving new content until prices go down: “I've decided to just call it quits for now. I don't really download much anymore. I just maintain my current data.” “Slim pickings currently. Check Facebook marketplace as occasionally a deal can be had there especially from people who accidentally bought a sas drive and can't use it.” “I'm looking for efficient ways to use older smaller drives that I have laying around doing nothing, because I need more space for backups. I can't see buying a 28tb drive right now. I've started adjusting my backup retentions to stretch the space I have.” “Bust out your wallet is the only way or try to ride this out and hope prices come down.” “You don't [buy new drives] right now. Better pray we actually get drives going forward.” “Every vendor i worked with offered me a dinner and told me wait when i asked for a rather large quote.” “Bwwaahahahahahahahahhahaha.....not until 2029...MAYBE. All the AI/datacenters have prepurchased hard drives.” The question that seems to be on everyone's mind is how long will this shortage last, and will the price of storage ever go down again? About the author Jason is a cofounder of 404 Media. He was previously the editor-in-chief of Motherboard. He loves the Freedom of Information Act and surfing. More from Jason Koebler