블로그
후기
멘토진
← 블로그 목록으로 돌아가기
Embeddings란 무엇일까? / Semantic Space
JSCODE 시니
2026. 06. 13.
author
JSCODE 시니
category
Spring AI
createdAt
Jun 13, 2026 09:48 AM
isPublic
isPublic
series
실무에 바로 적용하는 Spring AI: Spring 서비스에 챗봇·RAG·MCP 도입하기
slug
understanding-embeddings-and-semantic-space
type
post
updatedAt
✅ 1. Embeddings란 무엇일까?
텍스트, 이미지, 비디오 등 사람이 사용하는 데이터를 AI가 계산할 수 있도록
수많은 숫자들의 배열(Vector)로 변환한 표현 방식
컴퓨터는 '사과'나 '바나나'라는 단어의 진짜 의미를 모름. 단지 문자로 인식함
하지만 이 단어들을
[0.12, -0.45, 0.89, ...]
같은 복잡한 숫자 좌표로 번역해주면, AI는 수학적 계산을 통해 입력된 데이터 간의
관계와 패턴을 포착할 수 있음
✅ 2. 의미론적 공간과 거리계산
의미론적 공간(Semantic Space)
가까운 거리 = 비슷한 의미
의미가 비슷한 데이터일수록 숫자 좌표상에서 서로 가까운 위치에 모이게 됨
거리 계산으로 유사도 파악
‘강아지’와 ‘멍멍이’는 글자가 완전히 다르지만, 임베딩을 거치면 두 단어의 수치적 거리가 매우 가깝게 나옴 ⇒
유사도가 높음
반대로 ‘강아지’와 ‘자동차’는 의미가 전혀 다르므로 좌표 공간에서 아주 멀리 떨어지게 됨
AI는 이 두 벡터 간의 거리를 수학적으로 계산하여 유사도를 파악함.
✅ 3. 실무 활용 분야
임베딩 기술은 단순히 단어를 숫자로 바꾸는 것을 넘어, 현대 AI 서비스의 핵심 인프라로 쓰임
의미론적 검색
단순한 '키워드 일치' 검색을 뛰어넘는 검색
유저가 ‘돈 돌려주세요’라고 검색창에 쳤을 때, '돈'이나 '돌려'라는 단어가 하나도 없는
‘
환불 및 결제 취소 규정’
문서를 찾아줄 수 있음. (문장의 '의미' 거리가 가깝기 때문)
Spring AI에서 사내 문서를 검색하는 등의
RAG(검색 증강 생성) 시스템의 핵심 기술
텍스트 분류
문장의 의미 좌표를 분석하여 스팸 메일을 자동으로 걸러내거나, 영화 리뷰가 긍정적인지 부정적인지 분류할 수 있음
제품 및 콘텐츠 추천
넷플릭스 영화나 쇼핑몰의 상품들을 모두 벡터 숫자로 변환함
유저가 특정 상품을 클릭하면, 그 상품과
가장 거리가 가까운(유사한 특징을 가진)
다른 상품들을 자동으로 추천해줌