JSCODE Logo
블로그후기멘토진
회사명 : JSCODE대표 : 박재성사업자 등록번호 : 244-22-01557통신판매업 : 제 2023-인천미추홀-0381 호
학원 명칭 : 제이에스코드(JSCODE)원격학원학원설립ㆍ운영 등록번호 : 제6063호

서울특별시 구로구 경인로 20가길 11(오류동, 아델리아)

Copyright ⓒ 2025 JSCODE - 최상위 현업 개발자들의 프로그래밍 교육 All rights reserved.

이용약관개인정보처리방침
← 블로그 목록으로 돌아가기

Embeddings란 무엇일까? / Semantic Space

JSCODE 시니
JSCODE 시니
2026. 06. 13.
author
JSCODE 시니
category
Spring AI
createdAt
Jun 13, 2026 09:48 AM
isPublic
isPublic
series
실무에 바로 적용하는 Spring AI: Spring 서비스에 챗봇·RAG·MCP 도입하기
slug
understanding-embeddings-and-semantic-space
type
post
updatedAt

✅ 1. Embeddings란 무엇일까?

notion image
  • 텍스트, 이미지, 비디오 등 사람이 사용하는 데이터를 AI가 계산할 수 있도록 수많은 숫자들의 배열(Vector)로 변환한 표현 방식
  • 컴퓨터는 '사과'나 '바나나'라는 단어의 진짜 의미를 모름. 단지 문자로 인식함
  • 하지만 이 단어들을 [0.12, -0.45, 0.89, ...] 같은 복잡한 숫자 좌표로 번역해주면, AI는 수학적 계산을 통해 입력된 데이터 간의 관계와 패턴을 포착할 수 있음
 
 
 

✅ 2. 의미론적 공간과 거리계산

notion image
notion image
  • 의미론적 공간(Semantic Space)
  • 가까운 거리 = 비슷한 의미
    • 의미가 비슷한 데이터일수록 숫자 좌표상에서 서로 가까운 위치에 모이게 됨
  • 거리 계산으로 유사도 파악
    • ‘강아지’와 ‘멍멍이’는 글자가 완전히 다르지만, 임베딩을 거치면 두 단어의 수치적 거리가 매우 가깝게 나옴 ⇒ 유사도가 높음
    • 반대로 ‘강아지’와 ‘자동차’는 의미가 전혀 다르므로 좌표 공간에서 아주 멀리 떨어지게 됨
    • AI는 이 두 벡터 간의 거리를 수학적으로 계산하여 유사도를 파악함.
 
 
 

✅ 3. 실무 활용 분야

임베딩 기술은 단순히 단어를 숫자로 바꾸는 것을 넘어, 현대 AI 서비스의 핵심 인프라로 쓰임
  • 의미론적 검색
    • 단순한 '키워드 일치' 검색을 뛰어넘는 검색
    • 유저가 ‘돈 돌려주세요’라고 검색창에 쳤을 때, '돈'이나 '돌려'라는 단어가 하나도 없는 ‘환불 및 결제 취소 규정’ 문서를 찾아줄 수 있음. (문장의 '의미' 거리가 가깝기 때문)
    • Spring AI에서 사내 문서를 검색하는 등의 RAG(검색 증강 생성) 시스템의 핵심 기술
  • 텍스트 분류
    • 문장의 의미 좌표를 분석하여 스팸 메일을 자동으로 걸러내거나, 영화 리뷰가 긍정적인지 부정적인지 분류할 수 있음
  • 제품 및 콘텐츠 추천
    • 넷플릭스 영화나 쇼핑몰의 상품들을 모두 벡터 숫자로 변환함
    • 유저가 특정 상품을 클릭하면, 그 상품과 가장 거리가 가까운(유사한 특징을 가진) 다른 상품들을 자동으로 추천해줌