Innovating today, leading tomorrow

Trend Report
[알쓸잇잡] 비개발자도 이해하기 쉬운 필수 AI 용어

[알쓸잇잡] 비개발자도 이해하기 쉬운 필수 AI 용어

인공지능(AI)은 우리 삶의 다양한 부분에 깊숙이 스며들어 우리 주변 세상을 변화 시키고 있습니다. 하지만 뉴스나 컨텐츠를 보다 보면 종종 낯설고 어려운 용어들이 나오는데요.

이번 포스트에서는 IT 비전공자, 비개발자를 위해 ‘AI 관련 주제에서 자주 사용되는 필수 용어‘에 대해서 살펴보겠습니다. 초보자도 쉽게 이해할 수 있도록 각 용어에 대한 심층적인 설명과 활용 사례도 함께 추가했어요!

 

인공 지능 (Artificial Intelligence, AI)

인공 지능은 컴퓨터가 인간의 언어, 행동, 사고 등을 학습하여 이를 기반으로 추론, 의사 결정 등의 지적인 작업을 수행하는 기술을 말합니다. 인공지능을 통해 컴퓨터가 사람과 유사한 혹은 그보다 상위 수준의 지능을 가지고 문제를 해결하거나 의사 결정을 내릴 수 있게 되는 것이죠. 최근 생성형 AI가 급격하게 성장하면서 AI 활용 범위가 넓어지고 있습니다.

 

머신 러닝 (Machine Learning)

머신 러닝은 데이터로부터 스스로 학습하고 예측하는 AI 기술입니다. 과거 데이터를 기반으로 패턴을 파악하고, 새로운 데이터를 입력했을 때 어떤 결과가 나올지 예측하는 데 사용됩니다. 머신 러닝 기술을 통해 아래와 같은 일들을 할 수 있습니다.

  • 추천 시스템: 온라인 쇼핑몰에서 구매한 상품의 데이터를 분석하여 과거 구매 이력과 유사한 상품을 추천합니다.
  • 이미지 인식: 고양이와 개를 구분하는 것부터 의료 영상에서 암세포를 감지하는 것까지, 정밀한 이미지 인식이 가능합니다.
  • 음성 인식: 발음 마다 패턴을 파악하여 음성을 인식하는 기술입니다.
  • 사기 감지: 신용카드 사용 내역을 분석하여 사기성 거래 등이 발생할 때 나타나는 패턴을 분석하여 사기를 방지합니다.
  • 의료 진단: 의료 영상 데이터를 분석하여 질병 증상이 나타날 때의 데이터 패턴을 파악해 질병을 진단합니다.
  •  

자연어 처리 (Natural Language Processing, NLP)

컴퓨터가 사용하는 언어는 0과 1로 구성된 이진 코드입니다. 인간이 사용하는 언어와는 다르기 때문에 컴퓨터에게 명령을 하려면 컴퓨터 언어로 해야 하죠. 자연어 처리 (NLP)는 컴퓨터가 인간이 사용하는 언어의 특징과 의미를 이해하고 처리하는 기술입니다. 텍스트를 기반으로 하는 서비스에 많이 사용되는 기술이죠.

  • 언어 번역: 언어 별 특징을 파악해 다른 언어와 유사하게 번역하는 기술에 사용됩니다.
  • 감성 분석: 단어가 내포하고 있는 의미를 분석하여 제품 리뷰나 설문 결과를 파악하는 서비스 등에 사용되고 있습니다.
  • 텍스트 분류: 글이 제공하는 내용이 무엇인지, 어떤 형식으로 작성된 것인지 등을 파악하여 분류합니다.
  • 글 자동 완성: 사용자가 작성한 텍스트를 기반으로 의도를 예측해 다음 단어를 제시합니다. 유사한 기능으로 자동 수정도 있습니다.
  • 검색 엔진: 구글이나 네이버와 같은 포털 사이트에서 제공하는 기술로 관련 내용을 입력하면 비슷한 결과들을 파악하여 검색 결과를 제공합니다. 

  •  

LLM (Large Language Model)

LLM은 위에서 설명 드렸던 자연어 처리를 위해 학습에 사용되는 대규모 언어 데이터셋을 뜻합니다. 이 데이터셋은 책, 뉴스 기사, 논문, 사람들이 사용하는 여러 언어 등의 다양한 소스에서 수집되는데요. LLM은 이러한 데규모 데이터셋을 학습하여 언어의 특성을 학습하고 문맥을 이해하며 사용 패턴 등을 파악하게 됩니다. 

 

sLM (Small Language Model)

sLM은 LLM보다 데이터셋 규모가 작은 언어 모델입니다. 특정 산업이나 도메인 등에서 정확하고 구체적이고 빠르게 사용되는 언어의 특징과 패턴들을 파악하는 데에 주로 사용됩니다. 휴대폰에 적용된 AI의 경우 휴대폰이 가지고 있는 하드웨어의 제한된 환경에 의해 sLM을 사용하여 효율적으로 데이터를 학습하게 됩니다. 만약 기업에서 기업 내부 업무를 위한 AI챗봇을 사용하기 위해 데이터를 학습 시켜야 한다면, 범용적인 LLM보다는 회사 내부의 데이터에 특화된 sLM이 적합할 것입니다. 

 

벡터 검색 (Vector Search)

벡터란 공간상의 하나의 점입니다. AI에서는 이 공간상의 위치를 활용하여 데이터를 저장하기도 하는데요.  벡터 검색은 데이터들의 특징을 추출하여 이를 벡터로 표현해 저장함으로써 유사한 데이터를 빠르고 효율적으로 찾는데 활용되는 기술입니다.  주로 이미지, 동영상, 문서 등의 정형화되지 않은 형태의 데이터들을 처리하는데 사용되는데요.  검색 시에 빠르게 유사성을 판단할 수 있다는 장점이 있습니다. 

  • 검색 엔진: 자연어 처리처럼 벡터 검색도 검색 엔진에 사용됩니다. 여러 형태의 데이터들을 벡터로 파악해 유사한 데이터들을 빠르게 도출할 수 있기 때문에 많이 사용됩니다.
  • 이미지 검색: 텍스트 뿐만 아니라 이미지의 유사도를 파악하는 데에도 벡터 검색을 사용할 수 있습니다. 
  • 소셜 미디어(SNS) 분석: SNS에서 실시간으로 생산되는 텍스트, 이미지, 동영상 등을 벡터 검색을 활용하여 유사한 콘텐츠나 트렌드를 분석합니다.
  • 영상, 행동, 모션 분석: 자율주행 자동차의 경우 주변 교통 상황을 빠르게 이해하고 분석하기 위해 벡터 검색을 사용합니다. 사람의 움직임을 추적하고 분석하여 패턴 등을 파악할 수 있습니다.
  • 생물 정보학: 유전 서열이나 단백질 구조와 같은 생물 정보를 벡터로 표현하여 각 유전자의 기능이나 서열을 분석하거나 단백질의 구조와 상호작용을 예측하는 등의 연구에도 사용되고 있습니다.
  •  

환각현상 (Hallucination)

환각현상은 AI 모델이 실제로 존재하지 않는 정보를 진짜처럼 만들어내는 현상입니다. AI가 학습한 데이터들이 잘못된 정보를 기술하여서 발생할 수도 있고, 너무 많은 양의 데이터를 학습하다 보니 데이터 간의 패턴이나 객체를 잘못 인식하거나 복잡한 구조 등의 다양한 이유로 환각현상이 나타날 수 있습니다.

하지만 환각현상이 무조건 나쁜 것은 아닙니다. 창의력을 가진 AI이기 때문에 그림을 그리거나 시를 짓는 등의 예술적인 결과물을 만들어내기도 하고 생각지 못했던 답변들을 내놓으면서 깨우침을 제공하기도 합니다. 

그럼에도 불구하고 이러한 환각현상이 주는 부작용도 무시할 수 없기 때문에 이를 줄이기 위해선 학습 시 사용하는 데이터를 정제하여 정확도를 높이고, 모델의 복잡도를 줄여 과적합을 방지하는 등의 노력이 필요합니다. 최근 일부 생성형AI 서비스에서는 환각현상을 최소화 하는 방법으로 팩트 체크가 가능하게끔 결과물의 출처를 제공하기도 합니다. 

 

프롬프트 엔지니어링 (Prompt Engineering)

프롬프트는 AI에게 특정 작업을 수행하도록 요청하는 자연어 텍스트 입니다. 흔히 우리가 챗GPT에게 ‘업무 요청 메일을 써줘’와 같이 명령하는 내용을 프롬프트라고 하죠. 하지만 단순히 ‘업무 요청 메일을 써줘’ 라고 하는 것 보다는 ‘너는 영업사원이야. 정중하고 부드럽게  마케팅팀에 A와 B의 이유로 C 업무 협조를 요청하는 메일을 작성해줘.’ 라고 하는 것이 더 원하는 답변을 얻는데 효과적일 것입니다. 

프롬프트 엔지니어링은 이렇게 AI가 원하는 방향으로 작업을 수행할 수 있도록 유도하기 위해 프롬프트를 설계하고 최적화하는 과정을 뜻합니다. 원하는 고품질의 관련성 높은 결과를 얻으려면 그만큼 지침도 명확하고 상세해야 하듯이 AI에게도 동일한 작업이 필요합니다. AI에게 명확하고 정확한 정보를 제공하여 더욱 원하는 결과를 얻도록 하는 데 중요한 역할을 합니다.

 

마치며

지금까지 IT 비전공자, 비개발자를 위한 ‘AI 관련 주제에서 자주 사용되는 필수 용어’에 대해서 살펴보았습니다. AI 기술이 점점 진화하는 만큼 앞으로 더 많은 AI 용어들이 등장하며 미래의 기술에 중요한 역할을 맡게 될 것입니다. 앞으로도 티베로 블로그를 통해 유익한 정보들을 제공하며 여러분들과 함께 IT 지식을 쌓아가겠습니다. 알쓸잇잡 많은 관심 부탁 드립니다!

 

 

광고성 정보 수신

개인정보 수집, 활용 목적 및 기간

(주)티맥스티베로의 개인정보 수집 및 이용 목적은 다음과 같습니다.
내용을 자세히 읽어보신 후 동의 여부를 결정해 주시기 바랍니다.

  • 수집 목적: 티맥스티베로 뉴스레터 발송 및 고객 관리
  • 수집 항목: 성함, 회사명, 회사 이메일, 연락처, 부서명, 직급, 산업, 담당업무, 관계사 여부, 방문 경로
  • 보유 및 이용 기간: 동의 철회 시까지

※ 위 개인정보 수집 및 이용에 대한 동의를 거부할 권리가 있습니다.
※ 필수 수집 항목에 대한 동의를 거부하는 경우 뉴스레터 구독이 제한될 수 있습니다.

개인정보의 처리 위탁 정보
  • 업체명: 스티비 주식회사
  • 위탁 업무 목적 및 범위: 광고가 포함된 뉴스레터 발송 및 수신자 관리
 

개인정보 수집 및 이용

개인정보 수집, 활용 목적 및 기간

(주)티맥스티베로의 개인정보 수집 및 이용 목적은 다음과 같습니다. 내용을 자세히 읽어보신 후 동의 여부를 결정해 주시기 바랍니다.

  • 수집 목적: 티맥스티베로 뉴스레터 발송 및 고객 관리
  • 수집 항목: 성함, 회사명, 회사 이메일, 연락처, 부서명, 직급, 산업, 담당업무, 관계사 여부, 방문 경로
  • 보유 및 이용 기간: 동의 철회 시까지

※ 위 개인정보 수집 및 이용에 대한 동의를 거부할 권리가 있습니다.
※ 필수 수집 항목에 대한 동의를 거부하는 경우 뉴스레터 구독이 제한될 수 있습니다.

개인정보의 처리 위탁 정보

  • 업체명: 스티비 주식회사
  • 위탁 업무 목적 및 범위: 광고가 포함된 뉴스레터 발송 및 수신자 관리
  •