본문 바로가기
사무 전산 정보/Excel 엑셀

EXCEL 엑셀 불규칙한 텍스트에서 원하는 문자 추출하는 방법

by 인포민 2024. 9. 5.

엑셀에서 불규칙한 텍스트를 추출하는 작업은 여러 텍스트 함수를 조합해서 규칙성을 찾아서 처리할 수 있습니다. 

 

텍스트 함수로 LEFT, RIGHT, MID, FIND 함수 등이 있습니다. 이 함수들을 잘 활용하면 대부분의 불규칙한 패턴의 셀에서 원하는 텍스트를 추출할 수 있습니다.

엑셀 텍스트 함수 정리

 

왼쪽 기준으로 추출 (LEFT 함수)

 

먼저 LEFT 함수를 이용해서 왼쪽에서부터 순서대로 지정된 값을 추출하는 법입니다.

 

LEFT 함수

= LEFT(문자열, 추출할 글자수)

 

예를 들어, "(06128) 서울 강남구 강남대로 100길" 같은 우편번호가 A1 셀에 있다고 가정합니다.

왼쪽 우편 "(06128)"까지 추출한다고 할 때, 7자리 텍스트가 있습니다.

 

= LEFT(A1, 7) ▶ (06128)

 

 

우편 번호만 추출할 수 있습니다.

 

오른쪽 기준으로 추출 (RIGHT 함수)

 

다음으로 RIGHT 함수는 오른쪽에서부터 순서대로 지정된 값을 추출하는 함수입니다.

 

RIGHT 함수

= RIGHT(문자열, 추출할 글자수)

 

이번에는 "상품번호-12835"이라는 값의 숫자만 가져와야 한다면 RIGHT 함수를 사용하면 쉽게 처리할 수 있습니다.

 

= RIGHT(A1, 5) ▶ 12835

 

중간 기준으로 추출 (MID 함수)

 

MID 함수는 셀의 텍스트 시작 지점을 지정하여, 지정된 위치부터 글자수에 따라 결과 값을 추출하는 함수입니다.

 

MID 함수

= MID(문자열, 시작 위치, 추출할 글자수)

 

예시로, "주문번호_347863 _커피 "이라는 값에서 중간의 숫자만 추출할 수 있습니다.

 

= MID(A1, 5, 6) ▶ 347863

 

텍스트 위치 찾기 (FIND 함수)

 

FIND 함수는 특정 텍스트가 처음 나오는 위치를 찾아주는 함수입니다.

 

FIND 함수

= FIND(찾을 문자, 문자열, [시작 위치])

* 시작 위치는 생략 가능하며, 생략 시 기본 값은 1입니다.

 

위 주문번호 예시 "주문번호_347863 _커피 "처럼 "_" 기호가 2번 들어갑니다.

 

첫 번째 기호를 찾는 식

= FIND("_", A1) ▶ 5

 

두 번째 기호를 찾는 식

= FIND("_", A1, 6) ▶ 12

 

이렇게 위치를 찾는 데 사용할 수 있습니다. 위치를 찾게 되면 패턴에서 추출을 시작할 위치를 지정하는데 도움을 줄 수 있습니다.

 

텍스트 문자 개수 (LEN 함수)


LEN 함수는 텍스트의 문자 길이, 개수를 알려주는 함수입니다.

 

LEN 함수

= LEN(문자열)

 

"상품번호-12835"가 예시일 때 문자 개수 계산하여 10을 반환합니다.

 

= LEN( "상품번호-12835") ▶ 10

 

엑셀 불규칙 텍스트 추출

 

앞서 배운 함수들의 조합으로 불규칙한 텍스트를 추출할 수 있습니다. 문자수가 불규칙한 텍스트 배열에서도 추출하려는 기준을 찾아야 합니다. 

 

문자수가 다른 아이디나 이메일 주소를 추출하려면 "@"를 기준으로 두고 원하는 데이터를 추출할 수 있습니다.

 

예시문 - 이메일 아이디와 주소를 각각 추출하는 방법

 

다음과 같이 이메일이 있다는 예시를 두고, 각 아이디와 이메일 주소를 추출해 보겠습니다.

 

  • kimcheolsu@naver.com
  • parkjimin@daum.net
  • leeyounghee@gmail.com
  • choiminsu@gmail.com
  • jangmiyeong@naver.com

@를 기준으로 왼쪽에 있는 아이디와 오른쪽에 있는 이메일 주소를 분리하려면 아래처럼 작성하면 됩니다.

 

아이디 =LEFT( 문자열, FIND("@", 문자열) - 1)

 

kimcheolsu@naver.com

-------------▶ (문자 10개 추출)

 

왼쪽부터 문자를 추출해서 @ 앞의 문자까지 추출합니다.

FIND 함수로 @가 있는 위치를 찾으면 "11"이 나옵니다. 여기에  "-1"을 해주어 @ 위치 바로 앞까지 추출합니다.

 

이메일 =RIGHT( 문자열, LEN( 문자열 ) - FIND("@", 문자열 ))

 

kimcheolsu@naver.com

                     ◀------------- (문자 9개 추출)

 

오른쪽부터 문자를 추출해서 @ 다음부터 문자가 추출됩니다.

FIND 함수로 @ 문자의 위치를 찾으면 "11"이 나옵니다, 전체 문자 개수 "20"에서 @ 위치의 문자 개수를 빼면 오른쪽에서 @까지의 문자 개수 "9"를 알 수 있습니다. 

 

여기까지 엑셀에서 텍스트를 추출할 수 있는 함수들과 함수의 조합으로 불규칙한 패턴의 텍스트를 추출하는 방법에 대해 알아봤습니다.

 

댓글