[실습] 단어의 형태(-ed, -ing, -s 등)에 상관없이 검색하는 방법 (stemmer)
JSCODE 박재성
2025-12-06
author
JSCODE 박재성
category
Elasticsearch
createdAt
Dec 6, 2025
series
실전에서 바로 써먹는 Elasticsearch 입문 (검색 최적화편)
slug
exercise-stemmer
type
post
updatedAt
Dec 6, 2025 04:48 AM
✅ 단어의 형태(-ed, -ing, -s, -er 등)에 상관없이 검색하는 방법
영어 단어를 보면 play, playing, played, player 등 다양한 형태로 사용된다. 검색을 할 때 단어의 형태에 상관없이 검색이 가능하다면 훨씬 편하게 원하는 데이터를 조회할 수 있을 것이다. 지금부터 단어의 형태에 상관없이 검색하는 방법에 대해 알아보자.
Custom Analyzer를 활용해 인덱스 생성하기
// 기존 인덱스 삭제
DELETE /boards
// 인덱스 생성 + 매핑 정의 + Custom Analyzer 적용
PUT /boards
{
"settings": {
"analysis": {
"analyzer": {
"boards_content_analyzer": {
"char_filter": [],
"tokenizer": "standard",
"filter": ["lowercase"]
}
}
}
},
"mappings": {
"properties": {
"content": {
"type": "text",
"analyzer": "boards_content_analyzer"
}
}
}
}
// 잘 생성됐는 지 확인
GET /boards
이번 Analyzer에는 standard tokenizer(공백 또는 ,, ., !, ?와 같은 문장 부호를 기준으로 문자열을 자름)와 lowercase token filter(소문자로 변환)만 설정했다.
데이터 삽입하기
POST /boards/_doc
{
"content": "Running cats, jumping!"
}