k-digital training

250204_생성형AI-LLM 기본 개념, 기본 이해 및 활용

싱싱한복초이 2025. 2. 4. 18:54

⭐ML>DL>LLM의 큰 흐름

 

딥러닝모델에서의 필수적인 기능인 ATTENTION이란 무엇인가?

쉽게 말해서 높은 가중치를 부여하는 것이다. 

 

트랜스포머 모델, BERT, GPT

-출처

https://ffighting.net/deep-learning-basic/%eb%94%a5%eb%9f%ac%eb%8b%9d-%ed%95%b5%ec%8b%ac-%ea%b0%9c%eb%85%90/attention-and-self-attention-in-deep-learning/

 

Self Attention 설명 : 최소한의 수식과 관련 논문으로 쉽게 이해하기

다양한 일상 생활과 딥러닝의 사례를 통해 Attention의 개념을 설명합니다. 언어 모델과 비전 모델에 적용된 Self Attention의 원리를 최소한의 수식으로 쉽게 이해해봅니다. 파이썬으로 Self Attention을

ffighting.net

https://ffighting.net/deep-learning-paper-review/language-model/transformer/

 

Transformer 논문 리뷰 - ChatGPT 모델의 근간 확실하게 이해하기

Transformer 논문의 핵심 내용을 살펴봅니다. Transformer의 구조, Self Attention의 힘, 그리고 실제 실험 결과를 소개합니다. Transformer의 장단점과 중요성도 함께 알아봅니다.

ffighting.net

https://brunch.co.kr/@harryban0917/280

 

03화 Transformer의 자녀들 - BERT와 GPT

BERT와 GPT는 Transformer와 무슨 연관이 있을까? | 자연어처리 역사의 한 획을 그은 트랜스포머(Transformer)에서 BERT와 GPT라는 두 개의 서로다른 언어모델이 탄생하였습니다. BERT와 GPT는 둘다 트렌스포

brunch.co.kr

 

⭐LLM(Large Language Model)

- Open AI SDK Library

https://github.com/openai/openai-python

 

GitHub - openai/openai-python: The official Python library for the OpenAI API

The official Python library for the OpenAI API. Contribute to openai/openai-python development by creating an account on GitHub.

github.com

 

- RAG(Retrieval-Augmented Generation, 검색증강생성):

데이터베이스에서 질의 와 관련된 정보를 검색하여 이를 프롬프트에 함께 전달하는 방법

RAG란? - 검색 증강 생성 AI 설명 - AWS

 

RAG란? - 검색 증강 생성 AI 설명 - AWS

시맨틱 검색은 방대한 외부 지식 소스를 LLM 애플리케이션에 추가하려는 조직의 RAG 결과를 향상시킵니다. 오늘날의 기업은 매뉴얼, FAQ, 연구 보고서, 고객 서비스 가이드, 인사 관리 문서 리포지

aws.amazon.com

 

- Vector DB  

벡터 데이터베이스란 무엇인가요? | MongoDB

 

벡터 데이터베이스란 무엇인가요?

벡터 데이터베이스의 정의와 작동 방식, 그리고 MongoDB Atlas Vector Search가 생성형 인공지능 논의에서 중요한 역할을 하는 이유에 대해 알아보세요.

www.mongodb.com

 

 

 

---------------------------------------------궁금한 개념들-----------------------------------------------------

 

정형데이터와 비정형데이터란?

 

정형과 비정형을 나누는 기준은 컴퓨터이고 현재 기업이 사용하는 데이터의 80퍼센트는 정형데이터라고 할 수 있다,,

 

-참고할만한 글

https://chankim.tistory.com/3

 

[쉽게 설명한] 정형, 비정형, 반정형 데이터

데이터베이스라는 말은 누구나 들어봤을 것이다. 데이터를 저장하는 장소? 맞다. 그럼 데이터베이스에는 어떤 데이터를 저장할 수 있을까? 숫자? 텍스트(글자)? 그림(이미지)? 음성(소리)? 영상?

chankim.tistory.com

 

mission critical이란?

 

[위키백과] 시스템의 미션 크리티컬(mission critical) 요인은 사업 운영 또는 단체에 필수적인 요인(부품, 장비, 인원, 프로세스, 절차, 소프트웨어 등)이다. 미션 크리티컬 요인의 실패는 사업 운영이나 단체에 심각한 영향을 미치며 심지어는 사회적 혼란을 일으킬 수도 있다.

 

multi-agent란?

 

멀티모달(Multimodal) 인공지능(AI)은 다양한 유형의 데이터를 동시에 처리하고 해석하는 능력을 가진 AI 시스템이다. 전통적인 AI 모델이 텍스트, 이미지, 오디오 등 단일 형태의 데이터만을 처리하는 것과 달리, 멀티모달 AI는 텍스트, 이미지, 오디오, 비디오 등의 여러 데이터를 결합하여 더 풍부하고 정교한 결과를 생성한다.

멀티모달 AI의 핵심은 각기 다른 데이터 형태를 통합하는 능력에 있다. 예를 들어, GPT-4o와 같은 모델은 텍스트와 이미지를 동시에 입력받아 이를 바탕으로 종합적인 답변을 생성할 수 있다. 이는 사용자가 이미지 속 재료를 제공하면, 해당 재료로 만들 수 있는 요리를 제안하는 등의 응용이 가능하다.

 

-출처

https://wikidocs.net/253350

 

Multimodal AI (멀티모달 인공지능)

멀티모달(Multimodal) 인공지능(AI)은 다양한 유형의 데이터를 동시에 처리하고 해석하는 능력을 가진 AI 시스템이다. 전통적인 AI 모델이 텍스트, 이미지, 오디오 등 …

wikidocs.net

 

API란?

 

-참고

https://www.youtube.com/watch?v=Jg3FFBLyhK0

 

sLLM이란?

 

온디바이스 /CPU 환경을 고려한 저사양 모델

 

도커와 컨테이너 기술

 

 

langchain이란?

 

-참고

https://wikidocs.net/book/14473

 

랭체인(LangChain) 입문부터 응용까지

**랭체인(LangChain) 입문부터 응용까지** 이책은 거대언어모델(LLM)을 활용하여 애플리케이션과 파이프라인을 신속하게 구축할 때 주로 활용되는 랭체인(LangCha…

wikidocs.net

 

코퍼스란 무엇인가?

말뭉치(단수: corpus, 복수: corpora)는 자연어 처리와 언어학에서 사용되는 용어로, 언어 데이터(주로 텍스트)의 큰 집합을 의미한다. 말뭉치는 일반적으로 체계적으로 수집되고 구성된 텍스트 모음으로, 특정 언어, 방언, 주제, 스타일 또는 시대를 대표하는 텍스트들을 포함할 수 있다.  자연어 처리 분야에서 말뭉치는 언어 모델을 훈련하고, 언어의  통계적 패턴을 분석하며, 다양한 컴퓨터 기반 언어 연구에 사용된다.

 

-출처

https://wikidocs.net/179495

 

corpus, corpora (말뭉치, 코퍼스)

### 정의 말뭉치(단수: corpus, 복수: corpora)는 [자연어 처리](120214)와 언어학에서 사용되는 용어로, 언어 데이터(주로 텍스트)의 큰 집합을 의미한다. …

wikidocs.net

 

 

'k-digital training' 카테고리의 다른 글

20250206_python  (0) 2025.02.06
250203_OT,개발환경설정  (0) 2025.02.03