■ 김상진 / KAIST 전기·전자공학부 연구원
[앵커]
셀 하나로 데이터저장은 물론 연산과 데이터 변환까지 가능해 데이터 처리 속도를 획기적으로 개선한 새로운 개념의 지능형 AI 반도체가 세계 최초로 개발되었습니다. 오늘 '과학의 달인'에서는 셀 하나로 여러 기능을 수행하는 '다이나플라지아'에 대해서 자세하게 알아보겠습니다. KAIST 전기·전자공학부 김상진 연구원과 함께합니다. 어서 오세요.
새로운 개념의 AI 반도체를 세계 최초로 개발했다고 하니깐 어떤 건지 정말 궁금한데, '다이나플라지아'인데, 어떤 반도체인가요?
[인터뷰]
이번에 새롭게 개발된‘다이나플라지아’는 새로운 종류의 AI 반도체입니다. '다이나플라지아'라는 이름은 저희가 개발하면서 자체적으로 만든 이름인데요. Dyna와 Plasia의 합성어로 다양한 인공지능 모델을 처리 가능하다 는 의미로 지었습니다.
보통 AI 반도체를 설계할 때는 메모리 병목 현상이라는 것 때문에 그 성능과 효율에 제한이 걸리는데요, 이를 해소하기 위하여 메모리 내부에 프로세서를 집적하는 PIM 이라는 새로운 기술을 적용하였습니다.
'PIM' 이란, Processing-in-Memory 의 약자로 메모리 반도체에 인공지능 연산 기능을 추가한 지능형 반도체 시스템으로, 메모리 강국인 우리나라의 AI 반도체 세계시장 공략을 위한 핵심기술로 주목받고 있습니다.
특히 그중에서도 기존 대부분의 연구들과 다르게 PIM 기술을 DRAM에 적용하여 더욱 집적도를 높인 DRAM-PIM 기반 AI 반도체를 개발하였습니다.
[앵커]
네, 알 듯하면서도 좀 어려운 개념이지 않나 싶은데요, 하나씩 알아보겠습니다. 그렇다면 AI 반도체가 일반 반도체들과 어떤 것이 다른가요?
[인터뷰]
AI 반도체는 인공지능 연산에 특화된 반도체로 Neural Processing Unit, NPU 라고도 불립니다. 최근 인공지능 알고리즘의 발전으로 실제 생활에서도 인공지능을 많이 사용하는데, 이를 위해서는 항상 인공지능 연산을 수행할 수 있는 반도체가 필요합니다.
인공지능을 수행할 때는 수많은 계산을 해야 하는데, 이를 위해서 기존의 일반적인 컴퓨터에 사용되는 중앙 처리 장치(CPU)나 그래픽 처리 장치(GPU) 등의 반도체 등을 사용할 수 있습니다.
하지만, 인공 지능 반도체는 인공지능에만 사용되는 칩이라고 생각하면 됩니다. 따라서, 인공지능 반도체는 기존의 반도체와는 다른 설계로 구성되어, 인공지능 처리에 특화된 하드웨어와 소프트웨어를 사용하여 빠르고 효율적으로 인공지능 연산을 수행할 수 있습니다.
따라서, 인공지능 기술이 발전하면서 인공지능 반도체의 필요성은 더욱 높아지고 있으며, 인공지능 기술을 사용하는 많은 분야에서 인공지능 반도체의 활용이 예상됩니다.
이번에 개발한 다이나플라지아는 이중 에서도 DRAM- PIM 반도체를 사용하였는데 이를 좀 더 쉽게 포함관계를 설명 드리고자 합니다. 기존에 반도체가 있었다면 AI에 특화 된 반도체를 AI 반도체라고 하고 그 중에서도 특히 메모리와 함께 집적한 반도체를 PIM 반도체, 고집적도의 DRAM을 사용한 것을 DRAM 기반 PIM 반도체, 그 중에서도 저희가 새롭게 개발한 다이나플라지아가 있습니다.
[앵커]
그러니깐 다이나플라지아라는 반도체가 AI 시대를 이끌어갈 최신 반도체다 이렇게 이해를 하면 될 것 같습니다. 메모리 병목 현상을 해소하기 위해 메모리 내부에 새로운 기술을 적용하였다고 하는데, 여기서 '메모리 병목 현상'에 대해서 조금 더 자세히 설명해주시죠.
[인터뷰]
대부분의 기존 반도체는 ‘폰노이만 구조 (Von Neumann Architecture)를 기반으로 하는데요, 이는 정보 저장을 위한 메모리와 연산을 위한 프로세서가 분리되어있는 구조입니다. 이 구조에서는 프로세서가 연산을 위해 동작 할 때, 메모리에서 해당 연산에 필요한 데이터를 읽어와야 합니다.
따라서 프로세서와 메모리 간의 데이터 전송이 필요한데 이 과정에서 큰 전력 소모가 필요하고, 시간이 걸리는 문제가 발생하게 됩니다. 따라서 프로세서의 성능이 아무리 높아지더라도, 데이터 전송 속도에 의해 처리 속도와 전력 소모에 제약이 걸리게 되는데 이를 메모리 병목 현상이라 합니다.
이는 컴퓨터에서 처리하는 대부분의 작업에서 발생하는 문제이지만, 특히 인공지능 연산 처리에서는 대규모의 데이터를 다루기 때문에 더욱 심각한 문제가 됩니다.
앞서 설명 드린 것처럼, 인공지능에서 필요한 많은 연산을 빠르게 수행하기 위해 대부분의 인공지능 반도체는 병렬 처리 방식으로 동작하여 높은 처리량과 낮은 지연 시간을 보입니다. 하지만 이렇게 높은 처리 속도를 위해서는 더 많은 데이터를 빠르게 가져와야 합니다. 따라서 메모리 병목 현상은 인공지능 반도체 설계에 있어 가장 중요한 문제 중 하나입니다.
[앵커]
그렇다면 메모리 내부에 프로세서 연산기를 직접 하는 새로운 PIM 구체적으로 어떤 건가요?
[인터뷰]
PIM은 앞서 설명드린 것처럼 Processing-in-Memory의 약자인데요. 기존의 메모리와 프로세서가 분리된 폰노이만 방식의 컴퓨팅 구조와 달리, 메모리와 프로세서가 통합 된 구조를 말합니다. 즉, 그 이름에서 알 수 있다시피, 메모리 내부에 연산 로직이 집적되어 데이터 처리를 더욱 효율적으로 할 수 있도록 설계하는 기술입니다. 따라서 PIM 반도체는 기존의 폰노이만 구조의 반도체의 메모리 병목을 해소하고, 메모리에서 연산기로 데이터를 전송하기 위한 전력과 시간을 줄일 수 있습니다.
이러한 PIM의 장점 때문에 인공지능 반도체를 개발 하는데 있어서도 큰 관심을 받고 있습니다. 인공지능 분야에서는 대규모의 데이터를 빠르게 처리하는 것이 필수적이기 때문에, PIM을 사용 하면 높은 병렬성으로 동작 하면서도 메모리 병목 현상을 해결하여 빠른 처리 속도와 낮은 전력 소모를 보일 수 있습니다. 이번에 개발한 다이나플라지아는 이러한 PIM 기술을 DRAM 메모리에 적용한 방식입니다.
[앵커]
그러니깐 조금 전에 설명해주신 것처럼 프로세스가 아무리 개발이 되어도 메모리와 분리가 되어있던 구조적인 한계 때문에 성능을 올릴 수가 없었는데 이제는 프로세스의 성능을 발목 잡았던 문제들을 다 해결했다 이렇게 이해하면 될 것 같은데요. 그렇다면 이번에 개발하신 다이나플라지아의 장점 강점은 뭐가 있을까요?
[인터뷰]
기존 대부분의 PIM 반도체들은 SRAM 메모리를 사용 하였는데요. DRAM은 훨씬 높은 집적도를 갖는 메모리입니다. 다시 말해 DRAM을 사용하면 같은 크기의 반도체 칩을 만든다고 해도 훨씬 더 많은 용량을 가지고, 더 빠른 처리 속도를 보이게 됩니다.
이러한 DRAM의 장점 때문에 DRAM을 이용하여 PIM을 개발하려는 다른 연구들도 있었지만, DRAM 자체에서 발생하는 누설전류에 의한 설계의 어려움 때문에 성능이 제한적이었습니다. 개발된 '다이나플라지아'에서는 이러한 누설전류에 영향을 받지 않고 DRAM에서도 높은 처리 속도와 효율성을 보일 수 있는 새로운 아날로그 연산 방식을 개발해 적용하였습니다.
뿐만 아니라, 다이나플라지아에는 하나의 셀이 메모리, 연산기, 데이터 변환기의 기능을 동시에 지원할 수 있는 ‘트리플-모드 셀’을 개발되어 사용되었는데요, 이 때문에 더 복잡한 AI 모델을 더 효율적으로 가속 할 수 있게 됩니다.
정리하자면, 개발된 방식은 처리 속도를 높이고 효율성을 높여서, 인공지능 연산 시 기존 PIM 기반 반도체보다 더 빠르게 추론을 마칠 수 있고, 스마트폰 등 모바일 기기에서는 더 적은 배터리 소모로 인공지능 기능을 지원할 수 있게 됩니다.
[앵커]
그러니깐 다이나플라지아 개발하신 셀 하나로 데이터저장, 연산, 데이터 변환에 이르기까지 3가지 기능을 모두 할 수 있다는 건데, 원리를 좀 더 깊이 설명해주신다면요?
[인터뷰]
'다이나플라지아'에는 하나의 DRAM 셀이 메모리, 연산기, 데이터 변환기의 기능을 동시에 지원할 수 있는 ‘트리플-모드 셀’이 개발되어 사용되었는데요, 이를 통해 높은 집적도로 빠른 처리 속도를 보일 수 있고, 또한 더 복잡한 AI 모델을 더 효율적으로 가속할 수 있게 됩니다.
트리플-모드 셀은 데이터 3개의 트랜지스터와 2개의 축전기 구성되어 있는데요. 셀을 구성하는 트랜지스터와 모드 제어 선으로 적절히 제어하여 트리플-모드 셀의 3가지 모드가 지원됩니다.
예를 들어 연산을 수행하는 연산기 모드에서는 메모리 셀에 가중치를 저장하고 모드 제어 선으로 입력값을 넣어서 인공지능 연산에 필요한 곱셈 연산을 수행할 수 있습니다. 이러한 연산기 구조는 누설전류에 영향을 받지 않고 DRAM에서도 높은 처리 속도와 효율성을 보일 수 있는 새로운 아날로그 연산 방식을 지원합니다.
또한, 메모리로 쓰이는 경우에는 모드 제어 선을 통해 2개의 트랜지스터를 끄고 축전기로서 사용 하여 메모리 셀로 이용할 수 있게 합니다. 이렇게 되면 셀 주소를 선택하여 내부 데이터를 입출력 할 수 있습니다.
마지막으로 데이터 변환 모드에서는 모드 제어 선을 통해 하나의 단위 셀을 축전기 기반-DAC으로 변경하게 됩니다. 따라서 아날로그 입력값을 축차 비교 방식으로 디지털 값으로 변환할 수 있게 됩니다.
[앵커]
AI반도체가 무엇인지 그리고 그동안 반도체의 어떤 한계점이 있었는지 또 다이나플라지아가 그것을 어떻게 해결해왔는지를 자세히 설명해주셨는데요, 그렇다면 이 최신 반도체가 상용화가 된다면 어느 제품에 어떻게 쓰이나요?
[인터뷰]
다이나플라지아의 상용화는 두 가지 측면에서 의미가 있습니다. 첫 번째로, 다이나플라지아는 기존보다 높은 에너지 효율성을 보여 전력이 제한적인 환경에서도 AI를 보급할 수 있습니다. 이는 PIM 기술을 DRAM 메모리에 적용하여 데이터 처리 과정에서 발생하는 병목 현상을 해결하고, 더욱 빠른 데이터 처리와 저전력 운영을 가능하게 합니다. 따라서 기술이 더 상용화 된다면 스마트폰, 스마트 글래스, VR 등의 다양한 저전력 환경에서 AI를 효율적으로 가속하도록 보급할 수 있습니다.
두 번째로, 다이나플라지아는 고집적도의, 재구성 가능한 AI 반도체를 가능하게 합니다. 최근 인공지능 모델은 날이 갈수록 더 크기가 커지고 그 구조가 복잡해지고 있습니다. 이에 따라 더 높은 성능을 보이고, 다양한 인공지능 모델 구조에 대응 할 수 있는 AI 반도체가 필요해졌습니다. 이번에 개발된 다이나플라지아는 DRAM 기반의 구현으로 빠른 처리 속도를 보이는 고집적도의 AI 반도체일 뿐만 아니라, 트리플-모드 셀을 이용한 재구성으로 거대화되고 다양화되는 AI 모델에 대응할 수 있습니다.
[앵커]
그렇다면 상용화 단계는 현재 어디까지 왔다고 보십니까?
[인터뷰]
이번에 제안된 다이나플라지아는 기존의 PIM 기술을 DRAM에 적용한 것에 더하여 트리플-모드 셀을 개발하여 새로운 인공지능에 특화된 컴퓨터 구조의 가능성을 제시하였습니다. 그러나 상용화에 대해서는 몇 가지 과제가 남아 제가 장담하기는 어려운 부분이 있습니다만, 첫 번째로는 DRAM 전용 공정의 적용입니다. 반도체 공정에는 일반 반도체 공정과 DRAM 전용 공정이 따로 있는데요, 다이나플라지아는 현지 일반 반도체 공정을 통해 연구 개발 되었습니다.
DRAM 전용 공정을 사용하면 DRAM 자체의 집적도와 성능을 더욱 향상 시킬 수 있으며 이를 위해서는 D램 공정에 맞춘 칩 최적화와 외부 회로 간의 인터페이스 설계 등의 추가 개발이 남은 과제입니다.
또한, 이번에 개발된 방식은 기존의 폰노이만 구조와는 전혀 다른, 심지어는 PIM 과도 다른 새로운 구조입니다. 기존의 대부분의 소프트웨어와 하드웨어는 폰노이만 구조에 맞춰져 있는데 이를 새로운 구조에 적용하기 위한 소프트웨어 및 하드웨어 개발도 활발히 이루어져야 합니다. 이런 과제가 남았지만 다양한 분야의 활발한 연구와 기관들의 협력으로 머지않은 미래에 상용화 되기를 기대합니다.
[앵커]
우리나라가 가장 잘하는 것 중 하나가 '반도체'이고 최근 전 세계 IT 판도를 바꾸고 있는 기술이 'AI'인 만큼 이 두 가지 기술이 접목된 'AI 반도체'에 대한 기대가 큰데요. 앞으로도 계속된 연구로 전 세계 시장을 선도하는 우리 대표 기술이 되길 바랍니다. KAIST 전기전자공학부 김상진 연구원과 함께했습니다. 고맙습니다.
YTN 사이언스 김기봉 (kgb@ytn.co.kr)
[저작권자(c) YTN science 무단전재, 재배포 및 AI 데이터 활용 금지]