IT인프라의 거의 모든 것

세상의 중심, 데이터센터에서 클라우드까지 IT인프라의 다양한 기술을 리뷰합니다.

서버·스토리지·백업

[iWORKS Insight] AI가 쌓아올린 데이터의 무게 — 당신의 인프라는 이것을 버텨낼 수 있습니까?, 테이프 스토리지 LTO-10 이야기

손진성 2026. 5. 27. 20:46

'LTO-10 출시로 다시 주목받는 테이프 스토리지, 그리고 AI 시대의 데이터 보존 전략'

 

안녕하세요, Core·AI·HPC 인프라 전문기업 아이웍스(iWORKS) 디지털인프라사업본부입니다.

요즘 기업 IT 담당자들과 대화를 나누다 보면, 화제의 중심은 단연 AI 인프라입니다. GPU 서버 도입, 고속 네트워크 구성, AI 플랫폼 선택... 모두 중요한 주제입니다. 그런데 저희 컨설턴트들이 현장에서 자주 발견하는 또 하나의 공통적인 빈틈이 있습니다.

"그 AI가 학습한 데이터와 결과물, 지금 어디에 어떻게 보관되고 있습니까?"

이 질문에 자신 있게 답하지 못하는 기업이 생각보다 많습니다. 오늘은 이 주제를 중심으로, IBM Gold Partner인 아이웍스의 시각에서 AI 시대의 데이터 보존 전략LTO-10이 가져온 변화를 정리해 드리겠습니다.


AI 인프라 투자의 사각지대 — "데이터 보관"

많은 기업들이 AI 프로젝트를 시작할 때 컴퓨팅 파워에 집중합니다. 당연한 일입니다. 그러나 현장에서 보면 다음과 같은 패턴이 반복됩니다.

데이터 수집 → NAS에 적재 → GPU 학습 → 결과물 생성 → 그 이후 관리 체계 부재

학습에 사용된 원본 데이터셋이 라벨링 정보와 분리 보관되거나, 완성된 AI 모델의 버전 관리가 안 되거나, 6개월 후 재학습이 필요할 때 원본 데이터를 찾느라 오랜 시간을 허비하는 일들이 실제로 빈번하게 발생합니다.

AI 학습에 사용되는 데이터의 특성을 생각해 보면, 이 문제가 왜 심각한지 더 명확해집니다.

  • 이미지·영상·센서 데이터 등 비정형 데이터 위주로 용량이 TB~PB 단위에 달함
  • 학습 이후에는 빈번하게 접근하지 않지만 절대 버릴 수 없는 데이터
  • 규제·감사·재학습 목적으로 수년 이상 원본 보존이 요구됨
  • 데이터 유출이나 오염 시 AI 결과의 신뢰성 자체가 무너짐

이런 데이터를 고성능 All-Flash 스토리지에 계속 올려두는 것은 비용 낭비이고, 클라우드 Cold Storage는 처음엔 저렴해 보여도 대용량 데이터를 꺼낼 때 발생하는 Egress 비용이 수년 누적 시 예상을 훨씬 초과합니다.


IBM LTO-10 — AI 시대를 위해 진화한 테이프 스토리지

"테이프는 구시대 기술 아닌가?"라는 반응은 충분히 이해합니다. 그러나 2025년 출시된 IBM LTO-10은 그 인식을 바꾸기에 충분한 스펙을 갖추고 있습니다.

핵심 스펙 요약

항목 LTO-9 LTO-10
네이티브 용량 18TB/카트리지 30TB/카트리지
압축 용량 45TB 75TB
전송 속도 400MB/s 400MB/s (압축 시 1GB/s)
FC 인터페이스 8Gbps 32Gbps (4배 향상)
암호화 AES-256 양자내성암호 (Post-Quantum Cryptography)
미디어 최적화 필요 불필요 (제거됨)

세대 간 용량 증가율이 **67%**에 달하며, 특히 32Gbps Fibre Channel 인터페이스는 LTO-9 대비 4배 향상된 대역폭을 제공합니다. 대용량 AI 데이터를 테이프로 내릴 때의 시간이 그만큼 단축된다는 의미입니다.

주목할 또 하나의 포인트는 양자내성암호(PQC) 적용입니다. 미래의 양자 컴퓨팅 환경에서도 데이터 암호화의 안전성을 보장하겠다는 IBM의 선제적 설계입니다. AI 학습 데이터와 모델은 기업의 핵심 자산이자 기밀입니다. 보안 수준은 아무리 높아도 지나치지 않습니다.

LTO 로드맵 — 앞으로도 계속 진화합니다

2025년 11월, LTO Program(HPE·IBM·Quantum)은 40TB 카트리지 스펙을 추가 공개했습니다. 2026년 1분기 출하를 목표로 하며, 장기 로드맵 상 LTO-14에서는 카트리지당 900TB 이상을 목표로 하고 있습니다. 테이프 스토리지는 멈추지 않습니다.

[출처] lto.org


AI 인프라에서 LTO가 담당하는 역할

아이웍스는 고객사의 AI 인프라 설계 시 다음과 같은 **데이터 계층 구조(Tiered Storage)**를 권장합니다.

 
 
[ AI Compute / GPU Cluster ]
           ↕
[ All-Flash Storage ]  ← Hot 데이터: 현재 학습 중인 데이터셋
           ↕
[ HDD NAS / Object Storage ]  ← Warm 데이터: 자주 쓰지 않지만 접근 필요
           ↕
[ LTO Tape Library ]  ← Cold 데이터: 원본 데이터셋 / 완료 모델 / 장기 아카이브

각 계층이 담당하는 역할을 명확히 분리함으로써, 성능은 타협하지 않으면서도 TCO는 대폭 절감할 수 있습니다.

LTO 계층이 특히 효과적인 영역은 다음과 같습니다.

① 원본 데이터셋 장기 보존 — 전처리 전 원본 데이터와 라벨링 파일을 함께 패키징하여 아카이빙. LTO 테이프의 공인 수명은 30년입니다.

② AI 모델 버전 아카이빙 — 버전별 모델 가중치 파일을 체계적으로 보관하여 언제든 비교·복원 가능한 환경 구성.

③ Air-Gap 기반 랜섬웨어 방어 — LTO는 물리적 오프라인 매체입니다. 네트워크를 통한 랜섬웨어 공격이 테이프에 도달하는 것은 불가능합니다. 실제로 랜섬웨어 피해 복구 시 유일한 생존 복사본이 테이프였던 사례가 국내외에서 다수 보고되고 있습니다.

④ 비용 최적화 — 업계 분석 기준, 아카이브 데이터의 LTO 보관 비용은 디스크 및 클라우드 대비 최대 80% 절감 효과가 있습니다. 전력 소비 측면에서도 테이프는 데이터 비접근 상태에서 전력 소모가 거의 제로에 수렴합니다.


"아이웍스의 역량 — IBM Gold Partner로서 드릴 수 있는 것"

아이웍스는 IBM Gold Partner로서 IBM 스토리지 솔루션 전 라인업에 대한 기술 역량과 구축 레퍼런스를 보유하고 있습니다. 특히 IBM Champion으로 활동 중인 기술 전문가가 직접 고객사의 요구사항을 분석하고 최적의 아키텍처를 설계합니다.

아이웍스가 LTO 기반 AI 데이터 관리 환경 구축에서 지원할 수 있는 범위는 다음과 같습니다.

  • 현황 진단 — 현재 AI 데이터 보관 구조의 위험 요소 및 비용 낭비 포인트 분석
  • 아키텍처 설계 — Flash·Disk·Tape 3계층 기반 Tiered Storage 설계
  • IBM 테이프 라이브러리 구축 — TS4500, Diamondback 등 IBM 테이프 라이브러리 도입 및 구성
  • LTFS 기반 데이터 관리 — Linear Tape File System 기반의 직관적 데이터 접근 환경 구성
  • 백업·복제 통합 설계 — 기존 백업 솔루션과의 연계 및 DR 환경까지 포괄하는 통합 설계
  • TCO 분석 — 현재 구조 대비 LTO 도입 시 5년 TCO 비교 보고서 제공

마치며

AI 인프라의 완성은 GPU 클러스터가 아닙니다. 그 GPU가 학습하고 만들어낸 데이터 자산이 안전하게, 체계적으로, 경제적으로 보존될 때 비로소 완성됩니다.

LTO-10은 그 마지막 퍼즐 조각이 될 수 있습니다.

AI 데이터 보존 전략에 대해 고민 중이신 기업 담당자분들의 문의를 환영합니다.

📧 di@iworks.kr 🌐 www.iworks.kr


본 포스팅은 아이웍스 디지털인프라사업본부에서 작성하였습니다.

기고자: https://www.linkedin.com/in/okson/

 

#아이웍스 #iWORKS #IBM #LTO10 #테이프스토리지 #AI인프라 #데이터보존 #IBMGoldPartner #백업 #아카이브 #랜섬웨어대응 #TCO절감 #디지털인프라