Massive AI (초거대 AI) - ChatGPT » Design Thinker's Studio

“대규모 AI”는 일반적으로 인공지능(AI)을 대규모로 사용하는 것을 말하며, 일반적으로 많은 양의 데이터와 계산 능력을 포함한다. 여기에는 대규모 기계 학습 모델의 교육 및 배포, 빅 데이터 처리 및 분석, 복잡한 시뮬레이션 실행과 같은 작업이 포함될 수 있다.

대규모 AI의 예로는 방대한 양의 이미지, 비디오 및 오디오 데이터를 분석하고 이해하는 컴퓨터 비전 및 자연어 처리의 애플리케이션과 여러 센서의 데이터를 실시간으로 처리하고 분석하는 기능이 필요한 자율 시스템 및 로봇 공학의 애플리케이션이 있다.

금융 데이터, 의료 데이터, 과학 데이터, 소셜 미디어 데이터 등 대규모 데이터 분석에 AI를 활용하는 것도 한 예다. 이러한 데이터 세트는 너무 커서 기존 방법을 사용하여 처리할 수 없으며 통찰력을 추출하고 예측하기 위해 고급 기계 학습 알고리듬과 분산 컴퓨팅 시스템을 사용해야 한다.

우리가 사용할 수 있는 데이터와 컴퓨팅 능력의 양이 계속 증가함에 따라, 대규모 AI의 사용은 많은 분야에서 점점 더 중요해지고 있다.

다음은 대규모 AI의 대표적인 응용 프로그램 목록이다.

컴퓨터 비전: 객체 인식, 얼굴 인식, 이미지 생성과 같은 작업을 위한 대규모 이미지 및 비디오 분석.
자연어 처리: 언어 번역, 감정 분석, 텍스트 생성 등의 작업을 위한 대규모 텍스트 분석.
자율 시스템 : 자율주행차, 드론, 로봇 시스템 등의 작업을 위한 대규모 실시간 데이터 처리 및 분석.
의료: 질병 진단, 약물 발견 및 환자 모니터링과 같은 작업을 위한 대규모 의료 데이터 분석.
재무: 부정 행위 탐지, 리스크 관리 및 포트폴리오 최적화와 같은 작업을 위한 대규모 재무 데이터 분석.
소셜 미디어: 감정 분석, 추세 예측, 사용자 행동 분석 등의 작업을 위한 소셜 미디어 데이터의 대규모 분석.
추천 시스템: 제품 및 콘텐츠 추천과 같은 작업을 위한 사용자 데이터의 대규모 분석.
기후 모델링: 기후 및 날씨 패턴에 대한 대규모 시뮬레이션 및 예측.
유전체학: 유전자 발현 분석 및 약물 발견과 같은 작업을 위한 DNA 서열의 대규모 분석.
공급망 최적화 : 기계학습 및 최적화 기법을 이용한 물류 및 공급망 운영의 대규모 최적화.

이것들은 오늘날 거대한 AI가 사용되고 있는 많은 방법들의 몇 가지 예에 불과하다. 이 분야는 빠르게 발전하고 있으며 기술과 데이터 가용성이 발전함에 따라 새로운 애플리케이션이 항상 개발되고 있다.

빅테크 기업이 개발하고 출시한 대표적인 초거대AI는 다음과 같다.

GPT3.5
Google LaMDA
Google PaLM
DeepMind RETRO 70억개 파라미터
LG EXAONE
NAVER HyperClova – 한국어 정보 학습 강조
카카오 KoGPT – 60억개 파라미터
minDALI
Dalle
Naver Clova Studio – 제품 광고문구 생성

GPU 성능 향상

엔비디아 GPU V100 1초 125조번 실수 연산
엔비디아 A100텐서 코어 GPU = DL 학습 및 추론 과정에서 V100 대비 연산능력 20배

ChatGPT 특징

가장 발전된 DL 모델 ChatGPT
- CHAT: 단기 기억 보유
- G: Generative
- P: Pre-trained LLM (거대 언어 모델 사전 학습)
- T: Transformer 딥러닝 모델 (다음 단어가 무엇일지 예측, Attention = 핵심 키워드 파악)
1750억개 매개변수 사용
RLHF (Reinforcement Learning from Human Feedback): 사람이 만든 좋은 데이터로 학습, 약3.7조원 투입, 5조개의 자료 투입 학습
할루시네이션(hallucination)이슈: AI가 그럴듯하고 뻔뻔하게 잘못된 정보를 답변하는 오류