..

다수의 회원을 확보하고 하는 포털 업체들에게 고객과 관련한 데이터는 비즈니스의 뿌리라고
할 수 있다. 예기치 못한 사고로 인한 데이터의 유실에 대비해 안전하고 빠른 백업 및 복구
시스템을 갖춰야 하는 것은 바로 이 때문이다. 지난해 국내 최대 디지털 미디어의 하나인 야
후 코리아(대표 이승일 yahoo.co.kr)는 이를 위한 든든한 방비책을 마련했다. 리눅스 기반의
NAS 시스템 및 150여 개 클라이언트의 백업 및 복구를 위한 소프트웨어로 백본소프트웨어
(한국지사장 윤길태)의 ‘넷볼트’ 제품을 도입한 것. 현재 야후 코리아는 메일, 웹 서치, 클럽,
검색 DB 등 모든 중요 콘텐츠를 물리적으로 떨어진 두 곳의 데이터센터에 저장해 두고 넷볼
트로
이를 관리하고 있다. 본사의 백업 솔루션을 바꿀 정도로 영향력을 발휘한 야후 코리아
의백업 솔루션 도입 사례를 살펴본다.
........................................................................<정진옥 기자 ezen1048@sisait.co.kr>
 

최근의 일은 아니지만, 국내 최대의 e메일 서비스 업체인 다음커뮤니케이션은 e메일 서버 장애로
인해 3000여 명의 회원 정보와 e메일이 삭제되는 사건을 겪었다. 일부를 복구하기는 했지만, 사건
이 있었던 2000년 5월에 이 사건은 데이터 보관 및 복구에 대한 포털 업체들의 경각심을 다시금 일
깨우는 사건이었다.
사실 백업이란 것이 단숨에 투자 효과를 거둘 수는 없는 게 사실. 그래서 ‘사고’가 터지기 전까지는
백업에 대한 소중함을 잊고 지내는 경우가 허다하다. 그래서인지 인프라에 근간을 둔 서비스 업종
치고 야후 코리아처럼 두 곳의 데이터센터를 운용하면서 BCP(Business Continuity Plann- ing)나
DR(Disaster Recovery)을 고려한 예는 드문 경우다.

  500TB의 데이터 ‘넷볼트’로 백업
1997년 9월 국내에 서비스를 시작한 이래 야후 코리아는 뉴스/방송/검색 등의 미디어 서비스/클럽/e메일/메신저/게시판 등의 커뮤니티 서비스/쇼핑/공동 구매 등의 전자상거래 서비스와 교육, 모바일에 이르기까지 60여 개의 다양한 서비스를 제공하고 있다.
지난 4월 포털 업계 최초로 유료 서비스를 시작한 ‘비트박스’는 음원 80
여 만 곡을 확보하고 있으며, 서비스 한 달 만에 유료 회원이 8만 명을
돌파했다.
하반기 들어서도 7월 1일 지역검색 서비스 ‘거기’를 시작했다. ‘거기’는 약 700만 개의 텔레매틱스 DB를 기반으로 한 서비스이다. 뿐만 아니라 지난해 무료 웹 메일 용량을 100MB로 늘린 데 이어 올해 7월에는 우수 고객에게는 최대 1GB까지 제공키로 했다.
이처럼 다양한 서비스를 이용하기 위해 사용자들은 하루에 1억 9천만 번이나 야후 코리아를 드나들고 있다. 유니크유저 1천 9백만, 회원 수 2천 5백만 명이라는 명성도 그런 서비스 제공 능력에서 비롯된 것이다.
사용자들에게 중단 없는 서비스를 제공하기 위해 야후 코리아가 현재 보유하고 있는 데이터의 양은 500TB에 달한다. 이렇게 방대한 양의 데이터들을 안전하게 보관하는 것은 물론, 장애 시에도 데이터의 손실 없이 빠르게 복구할 수 있는 시스템을 구축하는 것은 불가결한 일이라 하겠다.
데이터가 급증하는 데 따라 야후 코리아가 전문 백업 솔루션을 검토하기 시작한 것은 2003년 초.
야후 코리아는 외부 전문 솔루션 업체의 제품을 도입하지 않고, 자체 개발한 백업 솔루션을 사용하고 있었다. 그러나 데이터가 급격히 늘어나 자체 솔루션으로는 감당하기 어려울 정도가 되면서 야후 코리아는 데이터의 중앙 관리를 위해 새로운 백업 솔루션을 도입할 필요를 느끼게 됐다.
전문 백업 솔루션을 도입하기로 한 야후 코리아는 솔루션 선정 작업에 들어갔다.
미국 본사는 물론, 야후는 전 세계 공동으로 베리타스소프트웨어의 백업 솔루션을 사용하고 있었다. 야후 코리아는 본사에서 사용하고 있던 베리타스소프트웨어의 제품을 비롯해, 백본소프트웨어와 CA 등 내로라하는 백업 소프트웨어는 모두 검토했다.
야후 코리아의 최용석 팀장은 “최적의 시스템을 구축하기 위해서는 소프트웨어의 역할이 중요하다”면서 “백업 시스템도 고객들의 데이터를 보호해야 한다는 점에서 하드웨어는 물론 소프트웨어의 선정이 핵심 요소 중 하나”라고 설명했다.
하드웨어의 장애는 수리해서 고치면 된다지만, 데이터가 삭제되면 복구할 수 있는 방법이 없다. 따라서 고객의 중요 데이터를 취급하는 포털 업체들에게는 백업 못지 않게 복구도 중요하다.
백업 솔루션들을 비교해 보고 몇몇 제품을 대상으로 2003년 9월엔 BMT도 실시했다.
최 팀장은 “야후 코리아는 500TB에 달하는 데이터를 네트워크 어플라이언스(이하 넷앱)의 NAS 스토리지 13대에 보관하고 있는데, 백업 솔루션은 NDMP(Net- work Data Management Protocol)를 지원하며, 데이터의 증가를 고려해 확장성과 유연성을 갖춘 제품이어야 했다”고 선정 기준을 밝혔다. 이를 통해 선정된 제품이 백본소프트웨어의 ‘넷볼트’였다.
야후 코리아는 완벽한 백업 시스템을 구현하기 위해 데이터센터 두 곳을 DR (Disaster Recovery) 센터 형태로 묶었다. IP 네트워크를 통해 연결돼 있는 KIDC 논현 센터와 서초 센터 두 곳을 브로케이드 SAN 스위치로 연결하고, 스토리지텍의 L700e 테이프 라이브러리를 도입했으며, 중요 데이터는 2차 백업을 적용했다. 두 데이터센터의 시스템의 서비스 지역 모두에 넷볼트가 도입됐는데, 지난해 12월부터 현재까지 도입된 규모는 약 150여 클라이언트에 이른다.
(그림) 야후 코리아의 세부 구성도

  ‘넷볼트’로 테이프에 직접 백업
야후 코리아가 솔루션 선정을 위한 BMT에 착수했던 2003년 9월은 넷볼트 신 버전인 7.1 버전이 출시된 시기와 절묘하게 맞아 떨어졌다.
당시 막 출시된 넷볼트(Netvault) 7.1은 유닉스, 리눅스, 윈도 NT/2000/XP, FreeBSD, 넷웨어, 유닉스웨어, Mac OS 등 대부분의 OS 플랫폼을 지원하는 백업 솔루션.
넷볼트 서버에 접속된 테이프 디바이스뿐 아니라 백업 대상이 되는 넷볼트 클라이언트에 스마트 클라이언트 옵션을 설치하면, 클라이언트에 접속된 테이프 디바이스도 백업이 가능해 클라이언트 로컬 백업을 실시할 수 있다. 이는 여러 사용자의 백업도 가능하게 해주는 기능이다.
사용 중인 테이프 드라이브를 SCSI나 SAN, NAS 환경의 넷볼트 서버와 클라이언트 간에 동적으로 공유할 수 있게 하는 동적 공유 옵션(Dynamically Shared Option)은 각각의 물리적인 드라이브에 설치해 테이프 디바이스 자원을 모든 클라이언트가 공유할 수 있도록 해준다.
또 여러 대의 가상 드라이브를 설정할 수 있어 여러 대의 백업 대상 클라이언트에 대해 동시 백업을 실시해 백업 시간을 단축할 수 있는 10TB 가상 라이브러리(10TB Virtual Library Capacity Upgrade License) 기능도 있다. 이 기능을 이용하면, 추후에는 하드디스크로 구성한 가상 테이프 라이브러리를 백업의 최종 미디어로 사용할 수도 있고, 한가한 시간을 이용해 실제 테이프 라이브러리로 데이터를 스케줄링해서 옮기는 2차 백업도 가능하다.
최용석 팀장이 특히 만족해하는 넷볼트의 중요한 기능 중 하나는 파일러로부터 테이프 장비에 바로 스냅 미러 이미지를 작성할 수 있는 ‘스냅미러 투 테이프(Snap Mirror to Tape)’ 기능이다.
야후 코리아의 환경은 여러 대의 넷앱 NAS 장비에 대다수의 데이터가 들어가 있다. 각 NAS 장비마다 소규모 파일 데이터가 대량으로 들어 있기 때문에, NDMP 모듈만으로는 백업 속도가 저하되거나 운영상의 문제로 현실적으로 백업이 불가능하다. 하지만 넷볼트의 스냅미러 투 테이프 모듈은 NAS의 볼륨 단위 데이터를 테이프 장비로 직접 백업할 수 있어, 백업 속도에 대한 문제를 해결했으며 데이터의 보호를 위한 백업을 효과적으로 매일 실시할 수 있게 했다.

  전 세계 야후도 ‘넷볼트’로 윈백
야후 코리아가 백본소프트웨어의 넷볼트를 도입한 사례는 한국지사에만 머문 것은 아니라는 점에서 더욱 의의가 있다.
야후 본사는 야후 코리아의 넷볼트 도입 사례를 살펴보더니 기존 백업 제품보다 훨씬 낫다고 판단, 전체 백업 솔루션을 넷볼트로 교체했다. 이에 따라 현재 야후 본사의 3PB에 달하는 데이터가 모두 백본 제품으로 관리되고 있으며, 미주 지역뿐만 아니라 아태, 유럽 지역의 야후에도 넷볼트가 설치되는 계기를 마련했다.
이에 더해 백본소프트웨어는 내년 중반에 야후만을 위한 넷볼트 7.4 버전을 출시할 예정이다. 넷볼트 7.4는 넷앱의 NAS 장비에 중점을 둔 소프트웨어 향상 및 업데이트 버전 제품이다. 스냅미러 투 테이프 기능의 향상과 대규모 서버에 대한 클라이언트 모듈 자동 설치 등에 따른 소프트웨어 설치 기능 향상, 엔터프라이즈 환경에서의 소프트웨어 운영 기능 등이 추가될 예정인데, 이 버전은 야후에서만 사용할 수 있으며 일반에는 공개되지 않을 예정이다.
이처럼 야후와 백본소프트웨어의 관계는 여느 솔루션 구입사와 판매사의 관계를 넘어섰다.
최용석 팀장은 “단순히 백업 솔루션만 도입한 데서 그친 것이 아니라 ‘야후’와 ‘백본소프트웨어’라는 회사 대 회사의 파트너 관계로 발전한 것이 더 의미 있는 성과”라고 강조했다.
현재는 본사 차원의 협력에 따라 백업의 엔지니어가 야후 본사에 상주하면서 여러 환경 변수에 대응하기 위한 추가 기능은 물론 교육 등의 지원 활동도 하고 있다.
BMT를 실시할 때부터 지금까지 1년여간 넷볼트를 써 온 최 팀장은 “10만 개의 리포트도 복구가 가능할 정도로 탄탄한 백업 및 복구 시스템을 구현했으며, 내년부터는 분기별로 백업 예산을 책정해 인프라의 증가에 따라 백업 및 복구 시스템 규모도 꾸준히 늘릴 예정”이라고 전했다.

 
 
Interview |야후 코리아 전산실· 최용석 팀장

 


포털 업체의 백업 소프트웨어는 어떤 조건을 갖춰야 하나?

대부분의 백업 소프트웨어는 백업 성능이 높고, 높은 하드웨어 사양을 필요로 하며, 백업 방법 설계 시에 여러 대의 서버가 필요하다. 그러나 포털 사이트의 경우 백업보다 ‘복구’가 중요하다. 신속하고 정확한 복구가 이뤄져야 중단 없는 서비스를 제공할 수 있기 때문이다. 또한 꾸준한 데이터의 증가를 뒷받침할 수 있는 확장성, 여러 장비를 운영하는 특성상 각종 OS 환경을 모두 지원해야 한다는 점도 중요하다. 데이터가 계속 변하기 때문에 이에 따른 주기적인 관리도 이루어져야 할 것이다.

백본소프트웨어의 ‘넷볼트’를 선택한 이유는?

넷볼트만의 독특한 스냅미러 투 테이프 기능이 특히 눈에 띄었다. 이 기능은 다른 업종에서는 많이 사용되지 않는 터라 타사에서는 개발을 거부했는데, 넷볼트는 이 기능을 기본으로 제공했다. 그밖에 야후의 환경에 맞도록 다른 여러 가지 지원도 원활히 이뤄졌다. 백업은, 백업 그 자체도 중요하지만 백업 이후의 주기적인 관리나 리포팅, 장애 상황에서의 복구 능력 등도 없어서는 안 되는 기능들이다. 그런 면에서 넷볼트는 아주 좋은 솔루션이다. 리포팅 기능도 강화돼 원하는 대로 템플릿의 구현이 가능하며 이를 위해 별도의 변환 프로그램도 필요 없어 편리하다. 또 백본소프트웨어 코리아 엔지니어들이 구축 당시 스케줄과 구축 방법은 물론, 방화벽과 향후 변경에 관한 이슈까지도 먼저 챙겨서 제안해주는 적극성을 발휘했다. 야후의 입장에서는 믿음직한 백업 파트너를 얻은 것이나 다름없다.

야후와 백본소프트웨어가 협력 관계를 맺은 의의는?

백업 시스템 구축에는 많은 비용이 들기 때문에 많은 포털 업체들이 투자를 주저하고 있다. 당장의 ROI를 환산할 수 없다는 점에서 더욱 그러할 것이다. 그러나 이것은 사용자 데이터의 소중함에 대한 인식이 부족한 데서 비롯한 위험한 발상이다. 포털 사이트에게 데이터 손실처럼 치명적인 ‘사고’는 없다. 포털 업체들이 대부분 이런 안이한 생각에서 벗어나지 못해 백업 시스템을 구축하지 않고 있다는 점이 우려스럽다.
야후와 백본소프트웨어의 본사 차원의 협력은 이러한 점에서 하나의 모범 사례라 할 수 있다. 공고한 협력 관계를 맺음으로써 앞으로 더욱 중요해질 백업에 대한 우려를 덜었을 뿐 아니라 가격 대비 투자 면에서 유리한 점이 많다. 포털 업체들이 백업 시스템의 중요성을 깨닫고 더욱 적극적인 행보를 보여야 할 때이다.

출처 : 시사컴퓨터[Case Study - 야후 코리아]..........