Massive AI (초거대 AI) – ChatGPT

“대규모 AI”는 일반적으로 인공지능(AI)을 대규모로 사용하는 것을 말하며, 일반적으로 많은 양의 데이터와 계산 능력을 포함한다. 여기에는 대규모 기계 학습 모델의 교육 및 배포, 빅 데이터 처리 및 분석, 복잡한 시뮬레이션 실행과 같은 작업이 포함될 수 있다.

대규모 AI의 예로는 방대한 양의 이미지, 비디오 및 오디오 데이터를 분석하고 이해하는 컴퓨터 비전 및 자연어 처리의 애플리케이션과 여러 센서의 데이터를 실시간으로 처리하고 분석하는 기능이 필요한 자율 시스템 및 로봇 공학의 애플리케이션이 있다.

금융 데이터, 의료 데이터, 과학 데이터, 소셜 미디어 데이터 등 대규모 데이터 분석에 AI를 활용하는 것도 한 예다. 이러한 데이터 세트는 너무 커서 기존 방법을 사용하여 처리할 수 없으며 통찰력을 추출하고 예측하기 위해 고급 기계 학습 알고리듬과 분산 컴퓨팅 시스템을 사용해야 한다.

우리가 사용할 수 있는 데이터와 컴퓨팅 능력의 양이 계속 증가함에 따라, 대규모 AI의 사용은 많은 분야에서 점점 더 중요해지고 있다.

다음은 대규모 AI의 대표적인 응용 프로그램 목록이다.

  • 컴퓨터 비전: 객체 인식, 얼굴 인식, 이미지 생성과 같은 작업을 위한 대규모 이미지 및 비디오 분석.
  • 자연어 처리: 언어 번역, 감정 분석, 텍스트 생성 등의 작업을 위한 대규모 텍스트 분석.
  • 자율 시스템 : 자율주행차, 드론, 로봇 시스템 등의 작업을 위한 대규모 실시간 데이터 처리 및 분석.
  • 의료: 질병 진단, 약물 발견 및 환자 모니터링과 같은 작업을 위한 대규모 의료 데이터 분석.
  • 재무: 부정 행위 탐지, 리스크 관리 및 포트폴리오 최적화와 같은 작업을 위한 대규모 재무 데이터 분석.
  • 소셜 미디어: 감정 분석, 추세 예측, 사용자 행동 분석 등의 작업을 위한 소셜 미디어 데이터의 대규모 분석.
  • 추천 시스템: 제품 및 콘텐츠 추천과 같은 작업을 위한 사용자 데이터의 대규모 분석.
  • 기후 모델링: 기후 및 날씨 패턴에 대한 대규모 시뮬레이션 및 예측.
  • 유전체학: 유전자 발현 분석 및 약물 발견과 같은 작업을 위한 DNA 서열의 대규모 분석.
  • 공급망 최적화 : 기계학습 및 최적화 기법을 이용한 물류 및 공급망 운영의 대규모 최적화.

이것들은 오늘날 거대한 AI가 사용되고 있는 많은 방법들의 몇 가지 예에 불과하다. 이 분야는 빠르게 발전하고 있으며 기술과 데이터 가용성이 발전함에 따라 새로운 애플리케이션이 항상 개발되고 있다.

빅테크 기업이 개발하고 출시한 대표적인 초거대AI는 다음과 같다.

  • GPT3.5
  • Google LaMDA
  • Google PaLM
  • DeepMind RETRO 70억개 파라미터
  • LG EXAONE
  • NAVER HyperClova – 한국어 정보 학습 강조
  • 카카오 KoGPT – 60억개 파라미터
  • minDALI
  • Dalle
  • Naver Clova Studio – 제품 광고문구 생성
GPU 성능 향상
  • 엔비디아 GPU V100 1초 125조번 실수 연산
  • 엔비디아 A100텐서 코어 GPU = DL 학습 및 추론 과정에서 V100 대비 연산능력 20배
ChatGPT 특징
  • 가장 발전된 DL 모델 ChatGPT
    • CHAT: 단기 기억 보유
    • G: Generative
    • P: Pre-trained LLM (거대 언어 모델 사전 학습)
    • T: Transformer 딥러닝 모델 (다음 단어가 무엇일지 예측, Attention = 핵심 키워드 파악)
  • 1750억개 매개변수 사용
  • RLHF (Reinforcement Learning from Human Feedback): 사람이 만든 좋은 데이터로 학습, 약3.7조원 투입, 5조개의 자료 투입 학습
  • 할루시네이션(hallucination)이슈: AI가 그럴듯하고 뻔뻔하게 잘못된 정보를 답변하는 오류