본 포스팅에서는 알리바바 클라우드의 AI가속기, AIACC에 대해 알아본다.
인공지능 기반 애플리케이션 및 서비스를 위한 딥 러닝이 필요한데 GPU가격 때문에 고민이셨던 분 혹은
AI 알고리즘을 더 빨리 처리할 수는 없을지에 대한 고민이 있으셨던 분들에게 많은 도움이 될 것이다.
AIACC (AI Accelerator) 란?
Apsara AI Accelerator (AIACC)는 알리바바 클라우드가 독자적으로 개발한 AI 가속기로, 안정적이고 사용이 편리한 Alibaba Cloud IaaS 리소스를 기반으로 한다. AIACC는 주요 AI 컴퓨팅 프레임워크를 기반으로 모델을 최적화하고 훈련 및 추론 성능을 개선하는 데 사용된다. AIACC는 FastGPU의 리소스 관리 도구와 연동하여 AI 컴퓨팅 작업을 구축하고 연구 개발을 보다 효율적으로 만들 수 있다.
AIACC의 장점?
–AIACC는 안정적이고 사용하기 쉬운 Alibaba Cloud IaaS 리소스를 기반으로 한다.
–AIACC는 FastGPU와 연동하여 교육 작업을 구축한다. 이렇게 하면 리소스를 만들고 구성하는 시간이 줄어든다. 또한 GPU 리소스 활용도를 향상시켜 비용을 절감한다.
–AIACC는 여러 프레임워크에 대한 통합 가속을 지원한다. 이것은 작은 적응 워크로드를 제공하고 훈련 및 추론 성능을 향상시킨다. AI 알고리즘은 더 짧은 검증주기로 개발되어 더 빠른 모델을 보장하고 이를 통해 연구 및 개발을 보다 효율적으로 수행할 수 있다.
AIACC 응용 분야
알리바바 클라우드의 AIACC는 2020년 3월, 미국 스탠포드대학교에서 발표한 돈벤치 (DAWNBench) 딥 러닝 대회에서 이미지 분류 트레이닝 및 추론 부문 1위에 선정되었다.
따라서 기존 AI 훈련 및 추론이 적용된 이미지 분류 및 이미지 인식, CTR 예측, 영상 Ultra HD 화질 향상, 자연어 처리 (NLP)와 같은 분야에서 사용하여 최대의 효과를 낼 수 있다. AIACC는 동일한 GPU를 사용해도 AI 의 학습/추론 속도를 더 빠르게 가속한다.
→이미지/텍스트 분류
ex) 손으로 쓴 숫자를 인식하도록 AI 훈련
→사물인식 및 분석
ex) 사진 또는 영상에서 등장하는 인물의 예상 연령대, 성별 등의 특징 감지
→ 음성 합성
ex) AI 기반의 대화형 인공지능 로봇
→자연어 처리 (NLP)
ex) 팬데믹 역학 조사 및 상담-예방-대응용 스마트 전염병 로봇
AIACC를 사용하여 딥 러닝 시나리오에서 애플리케이션 가속화
다음 인프라는 딥 러닝 시나리오에서 AIACC를 사용하는 방법을 보여준다.
–리소스 레이어 (Alibaba Cloud IaaS 리소스) : 리소스 레이어에서 Alibaba Cloud IaaS 리소스를 사용한다. 대규모 GPU 클러스터의 탄력적 컴퓨팅, 스토리지 및 네트워크 리소스 요구 사항을 충족하기 위해 리소스를 온디맨드로 활성화할 수 있다.
–스케줄링 계층 (AI 가속 자원 관리) : FastGPU를 사용하여 AI 컴퓨팅 작업을 구축하고 스케줄링 계층에서 대규모 GPU 클러스터의 자원을 관리한다.
–프레임 레이어 (AI 가속 엔진) : AIACC를 사용하여 프레임 레이어에서 다중 프레임 통합 가속을 구현한다. AIACC는 데이터 통신 기반의 성능 최적화 기술을 사용한다. AIACC가 분산 훈련을 구현할 때 AIACC는 가속 효과를 보장하기 위해 머신과 GPU간에 데이터를 교환해야 한다.
–애플리케이션 계층 (AI 가속 참조 솔루션) : 이미지 인식, 객체 감지, 비디오 인식, 클릭률(CTR) 예측, 자연어 이해, 음성 인식과 같은 다양한 애플리케이션 시나리오에서 딥 러닝을 구현한다. AIACC는 프레임워크 계층에서 여러 프레임워크에 대한 통합 가속을 구현하는 데 사용한다. 따라서 애플리케이션 성능을 향상시키려면 코드를 최소한으로 수정하기만 하면 된다.