인공지능 프로세싱에서 점점 더 중요해지는 에너지 효율
브랜든 루이스(Brandon Lewis)/ 마우저 일렉트로닉스(Mouser Electronics)
인공지능(AI) 애플리케이션이 복잡해짐에 따라 에너지 효율이 점점 더 중요해지고 있다.
AI가 환경, 경제, 기업의 운영에 미치는 영향은 이미 상당하다. 앨런 인공지능 연구소(Allen Institute for AI, AI2)의 제시 닷지(Jesse Dodge) 선임 연구원에 따르면, 챗GPT(ChatGPT)에 대한 1회의 질문 실행은 1개의 전구를 20분 동안 켜는 것만큼 많은 전기를 사용한다. 뿐만 아니라 데이터센터는 2030년까지 Al 기술의 진화와 확산으로 인해 에너지 수요가 두 배로 증가할 것으로 예상된다.
AI 연산, 특히 대규모로 실행되는 AI 연산은 엄청난 양의 탄소를 배출한다. 기술에 대한 수요가 증가함에 따라, 에너지 효율은 전력 소비를 늘리지 않으면서 기술 확장을 지원하는 것이 매우 중요하다. 더욱이, 기술의 에너지 사용을 최적화하면 지속 가능성에 기여할 뿐만 아니라 운영 비용을 줄이는 데에도 도움이 된다.
에너지 효율적인 Al는 대규모 또는 지속적인 AI 실행에서 더 효과가 높으며, 전력이 제한된 장소에서 사용하는 엣지(edge) 디바이스에서도 에너지 사용은 중요한 고려 사항이다. 에너지 효율적인 AI는 배터리 수명을 연장하고, 다운타임을 최소화하며, 시스템의 신뢰성을 향상시킬 수 있기 때문이다. 데이터센터의 탄소 배출 및 에너지 보고 규정 또한 최근 몇 년간 더욱 엄격해졌다.
이 글에서는 비용을 통제하고, 환경을 보호하며, 규제 요건을 준수하면서 AI 기술의 지속적인 발전을 지원하기 위한 저전력 Al 칩, 새로운 아키텍처, 그래프 신경망(GNN), 엣지 AI 프로세싱 등과 같은 여러 혁신들을 살펴본다.
저전력 AI 칩의 부상
지난 몇 년 동안 하드웨어 제조회사와 설계 엔지니어들은 전력 효율과 성능 간의 균형을 맞추기 위한 새로운 방법들을 모색해 왔다.
스마트폰용 프로세서 코어의 주요 공급회사인 Arm은 오랫동안 전력 효율에 집중해왔다. 오늘날 이러한 전력 효율에 대한 집중은 스마트폰에만 국한되지 않고 AI에도 적용된다. 예를 들어, Arm은 자사의 네오버스(Neoverse) CPU가 클라우드 데이터센터에 가장 전력 효율적인 프로세서라고 말한다. Arm에 따르면, 아마존 웹 서비스(AWS) 그래비톤(Graviton) 시스템에 배포되었을 때 네오버스 CPU는 경쟁 아키텍처보다 60% 더 나은 효율을 달성했다고 한다.
한편, 미디어텍 Al 프로세서는 특히 스마트폰, 스마트 홈 기기, 웨어러블 기술 및 자율 주행 차량에서 에너지 효율적인 Al 가속을 지원한다. 미디어텍에 따르면, 해당 NPU(neural processing unit)는 일반 CPU보다 27배, 일반 GPU보다 15배 더 나은 전력 효율을 나타낸다.[4] 미디어텍은 2023년에 소프트웨어 개발 키트와 개발 도구 모음을 모두 지원하는 7세대 NPU를 출시했다.
마지막으로, 인텔 비디우스 VPU(Vision Processing Unit)는 컴퓨터 비전 애플리케이션을 위해 특별히 설계되었다. 이 하드웨어는 병렬 프로그래머블 컴퓨팅과 워크로드별 Al 하드웨어 가속을 결합하여 데이터 이동을 최소화한다. 인텔은 PC 워크로드를 위한 VPU와 카메라 및 임베디드 시스템에 특화된 Movidius X VPU를 모두 제공한다.
이 에너지 효율적인 하드웨어는 엣지 Al 프로세싱을 가능하게 하여 클라우드 서버에 대한 의존도를 줄이는 데 도움이 될 수 있다. 에너지 소모가 많은 데이터 전송을 관리할 필요 없이, 임베디드 시스템은 자체 하드웨어를 활용할 수 있다. 이는 지속 가능한 AI 접근 방식에 기여할 뿐만 아니라, 스마트 기기와 웨어러블의 실시간 운영과 배터리 수명 연장을 동시에 지원한다.
에너지 효율적인 Al 프로세싱 분야의 신기술
신경망 기반 머신 러닝 모델은 오랫동안 AI에서 필수적이었다. 뉴로모픽(Neuromorphic) 칩은 이러한 접근 방식을 하드웨어 설계에 적용한다. 이러한 아키텍처는 신경과학과 생물학에서 많은 부분을 가져온 결과, 기존의 실리콘 칩에 비해 적응력, 성능, 에너지 효율, 병렬 처리 지원이 더 뛰어난 인공 뇌와 유사한 것을 만들어냈다.
하드웨어에 대한 완전히 새로운 접근 방식이 등장하고 있다. 최근 중국 연구진들은 탄소 나노튜브를 기반으로 한 텐서 프로세싱 유닛(TPU)를 발표했다. 이 칩의 독특한 아키텍처는 9개의 프로세싱 유닛이 3 x 3의 격자(grid) 형태로 긴밀하게 결합된 3,000개의 탄소 나노튜브 FET(field-effect transistor)로 구성된다. 각각의 유닛들은 상위 유닛으로부터 데이터를 받아 그 일부를 처리한 후 하위 유닛에게 전달한다.
지용 장(Zhiyong Zhang) 연구원은 "우리는 탄소 기반 텐서 프로세서 칩을 기반으로 최대 88%의 정확도와 295μW의 전력 소비로 이미지 인식 작업을 수행할 수 있는 5층 구조의 CNN(convolutional neural network)을 구축했다. 이러한 전력 소비량은 모든 새로운 컨볼루션 가속 하드웨어 기술 중 가장 낮은 수준이다"라며, "시스템 시뮬레이션 결과에 따르면 180nm 기술 노드를 사용하는 이 탄소 기반 트랜지스터는 850MHz의 성능에 도달할 수 있으며, 에너지 효율은 1TOPS/W를 상회하여 동일한 기술 노드를 사용하는 다른 디바이스 기술에 비해 분명한 이점을 보여준다“고 말했다.
에너지 효율을 위한 그래프 신경망(GNN)
AI가 새로운 아키텍처를 통해서만 에너지 효율을 높일 수 있는 것은 아니다. 예를 들어 그래프 신경망(GNN)은 전력망의 에너지 효율을 크게 개선할 수 있다. 다른 머신 러닝 모델들과 비교했을 때, GNN은 전력망(grid) 관리 및 모니터링의 독특한 구조와 복잡성에 더 적합하며[8], 구성 요소 장애 및 고장에 대한 경고를 제공하고 보다 정확한 예측을 가능하게 한다.
또한 GNN은 태양광과 풍력 에너지원에서 얻은 데이터를 활용하여 에너지 분배를 최적화하고 손실을 최소화하는 재생 에너지 관리 분야에도 도움이 될 수 있다.
결론
에너지 효율적인 AI는 환경에 미치는 영향을 줄이고, 비용을 절감하며, 기기의 수명을 연장하고, 지속 가능한 확장을 위해 필수적이다. AI가 점점 더 정교해지고 자원 요구 사항들이 보다 집중적으로 증가함에 따라, 우리는 에너지 소비를 줄일 수 있는 새로운 방법을 찾아야 할 필요가 있다. 저전력 AI 칩, GNN, 엣지 AI, 그리고 GNN과 같은 혁신들은 올바른 방향으로 나아가는 단계이며, 이들이 함께 더 큰 발전을 지원할 가능성이 높다.