기본적인 전략 분석

마지막 업데이트: 2022년 1월 22일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
250만원, 고반발 금장 아이언세트, '60만원'대 72% 할인 판매!

기업의 목표는 이윤의 추구에 있으므로 시장성분석과 기술성분석을 통해 획득한 자료를 종합해 여러가지 재무제표를 추정하고, 필요한 자본의 규모를 결정하며 투자 안의 경제성을 평가하는 활동을 수행한다. 사업아이템이 시장성과 기술성을 만족시킨다 하더라도 최종적인 투자의 결정은 경제성의 여부에 있다고 해도 과언이 아니므로 경제성분석은 매우 신중히 결정되어야 한다.

경제성분석을 재무분석이라고 할 수 있는데, 재무분석은 시장분석과 기술분석에 서 나타난 결과를 가지고 창업 업종의 사업화에 필요한 소요자금 및 창업후의 수익성을 추정하기 위한 분석이다. 즉, 시장성분석을 통해서 장·단기적으로 예측되는 수입계획과 지출계획을 비교해 경제적 타당성을 평가한다. 경제적 타당성 분석은 추정재무제표를 근거로해 미래의 경영 상태와 자금 흐름 그리고 손익분기점 분석을 포함한다.

경제성 분석절차

기술성분석에서 타당성이 인정되면 경제성분석을 하게 된 다. 경제성분석의 절차는 먼저 총비용 및 원가를 추정해야 하고, 그 다음 최근 3년간의 추정 손익계산서와 추정 대차대 조표를 작성해야 하며, 현금흐름을 파악하기 위해 추정 현금 흐름표가 작성되면 경제성분석을 실시해야 한다. 추정 손익 계산서 작성 시에 유의해야 할 점은 매출액이나 매출원가의 추정이 중요하므로 객관적이고 신뢰할 수 있는 통계자료를 제시해야 한다. 경제성분석에서 경제성이 인정되면 미래의 재무 상태를 분석하고 투자운영부문 등 경제성 평가를 실시 한다. 경제성 평가에서 긍정적인 결과가 도출되면 투자 안의 제안 준비를 한다.

경제성 분석범위와 내용

경제성 분석범위는 투자수익 및 매출액에 관한 추정분석, 투 자비용 및 원가부문에 관한 분석, 손익분기점에 관한 분석, 재무적 타당성에 관한 분석 등으로 구분할 수 있으며 구체적 인 내용은 다음과 같다.

- 매출액 추이 및 판매목표를 토대로 한 손익계산서

- 원부자재 조달에 관련된 자료를 근거로 한 원부자재 소요 검토

- 노무비 수준 및 소요인원을 기초로 한 노무비 및 인건비 검토

- 제조활동에 필요한 연구개발비 등을 근거로 한 제조경비

- 판촉활동과 관련된 판매비 및 일반관리비

- 원리금상환 및 기술료 지급 등이 포함된 영업비용 명세

- 주문량 및 재고량 등에 기초한 제조원가

- 운영자금 흐름을 파악하기 위한 현금흐름표

- 경제적 ․ 재무적 타당성 분석

- 순현가법 , 회수기간법에 의한 투자수익비용의 분석

제품성 분석

제품성 분석이란 제품의 특성과 품질을 고려한 제품의 강·약 점과 제품의 수명주기(Product Life Cycle), 보급률에 대한 분석이다. 제품의 강·약점에 대한 분석은 타사제품과 비교한 자 사제품의 기능, 특성, 정교성, 기술성, 브랜드 보유여부 등에 대한 분석을 하는 것이다. 이 경우 중요한 것은 기본적인 전략 분석 자사의 강점에 초점을 맞추어 분석하되 동시에 취약점 분석도 병행해 자 사의 경쟁력을 강화시키는 분석이 병행되어야 한다는 점이다.

다음으로는 제품의 수명주기와 보급률에 대한 분석이다. 모든 제품에는 수명주기가 존재하기 마련이며, 내가 시작하려고 하는 사업은 도입기, 성장기, 성숙기, 쇠퇴기 중 과연 어디에 속하는지를 도표를 그려가며 철저히 분석해야 할 것이다. 또한 현재 시장에 존재하는 제품을 가지고 기존 시장에 뛰어들 경우 기존회사의 제품 보급률에 대한 분석도 병행되어야 한다.

경쟁적 지위 분석

경쟁적 지위 분석이란 계획제품을 생산하는 경쟁기업의 범위와 경쟁요소를 분석하는 것이며, 시장성분석의 핵심 분석 요소이다. 경쟁기업의 범위는 계획제품과 동일 제품을 생산하는 기업과 유사제품의 생산기업과 나아가 대체제품을 생산하는 기업까지 분석의 대상으로 하는 것이 좋다. 선정된 기업을 대상으로 기본적인 재무상태, 생산능력과 생산실적, 그리고 기타 주요 경쟁요소를 분석한다.

먼저 기본적인 재무상태의 비교분석은 상장기업 재무총람이나 기업에서 공시한 재무제표를 이용해 분석한다. 또한 분석은 과거 약 3년 정도의 자료를 비교한 추세분석이 좀 더 유용할 수 있다. 재무 분석과 더불어 생산능력과 생산실적을 비교·분석하는 것은 경쟁기업의 잠재적인 생산능력을 분석하는 것이므로 매우 중요하다. 사업장 규모는 공장부지 면적, 건평 그리고 보유기계 대수로 분석할 수 있으며, 생산능력은 기업의 설비능력과 가동능력에 의해 분석할 수 있다.

노동집약적 산업의 경우 1일 또는 1개월간의 근무시간과 종업원 1인당의 생산실적을 고려해 연간 생산능력을 산출하고, 자본집약적 산업의 경우 생산설비의 능력에 대한 검토 후에 생산능력을 산정해야 한다. 결과적으로 생산능력은 연간생산 가능량을 가동률로 나누면 산출할 수 있다. 생산능력과 생산 가능량이 산정되면 경쟁회사의 손익계산서상의 매출액을 조사해 비교·분석한다.

시장 및 제품 환경 분석

시장 및 제품 환경은 크게 기업의 인적자원과 물적자원을 포함한 개념인 자연환경과 기술적 환경, 마케팅 환경으로 나누어 생각할 수 있다. 자연환경 중 인적자원에 대한 분석은 기 업의 인적자원의 사무수행능력, 생산기술 노하우, 영업조직의 효율성, 생산조직의 효율성, 신제품 개발능력 등이 분석대상이 될 것이다. 물적 자원에 대한 분석은 에너지 및 에너지 대체자원에 대한 수요·공급과 원재료에 대한 수요·공급의 용이성이 분석대상이 될 것이다.

기술적 환경요인 분석은 대내 외적인 기술 환경의 변화 추세를 미리 분석하고 예측함으로 써 그에 상응한 대책을 수립하기 위해 실시한다. 또한, 경쟁기업의 제품에 대한 당기업의 전반적인 기술수준을 측정해, 측정 결과를 토대로 시장점유율과 시장의 수요·공급에 어떠한 영향을 미치는지 분석되어야 한다.

마케팅 환경 분석은 당사에 가장 합당한 최적의 마케팅 전략은 어떤 것이며, 선택한 전략이 판매량 변화에 어떠한 영향을 미치는지를 분석대상으로 하며 판매방법은 직판인지 대리점 으로 할 것인지, 판매대금의 회수방침, 어음과 현금 결제비율의 정도 등을 미리 내규로서 정해 놓고 이에 대한 검토 분석 을 실시해야 한다.

판매계획

사업화 아이템에 대해 충분히 시장수요가 존재한다하더라도 어떻게 그 아이템을 시장에 도입시켜 자리를 잡느냐가 사업성공에 또 하나의 중요한 관건이 된다. 판매계획이란 어느 지역에서 언제, 얼마만큼 팔 것이냐의 목표를 정하고 그 목표를 달성하기 위한 여러가지 마케팅 수단들을 동원하는 마케팅 계획과 광고 및 판매촉진, 판매비용 계획을 말한다. 시장성 검토에서는 이러한 판매계획의 실현가능성과 적정성을 판단해 실제 제품을 생산해 출시했을 때 발생하는 생산차질에 대해 충분히 대비할 기본적인 전략 분석 수 있도록 한다.

경험적으로 보면 대부분의 제품에 있어서는 판매단가가 향후 판매량을 결정하는 주요 요인이 되는데 경쟁제품에 비해 우수한 품질의 경쟁력을 확보한 제품이라면 시장진입이 가능하겠지만, 그렇지 않은 경우에는 생각과는 달리 시장진입에 고전을 면치 못하게 된다. 흔히 경쟁제품이 새로 개발되어 시장에 나타나면 기존업체는 가만히 방관하는 것이 아니라 가격을 내리거나 품질을 더욱 개선시킴으로써 시장을 방어하고자 하므로 사업성 분석에는 반드시 이점을 염두에 두어야 할 것이다.

특히 수입제품을 국산화해 개발·도입 시에는 수입상대국은 원가 이하로 덤핑하는 경우가 많으므로 그 만큼 위험요소가 당초 예상보다 많아질 수 있다는 점을 감안해 가급적 사업계획 수립 시 보수적으로 잡아나갈 필요가 있다. 시장성의 평가 분야에는 시장성, 경쟁력, 업무추진능력, 그리고 재무구조의 4 분야로 나눌 수 있다. 각 분야별 평가항목은 다음과 같다.

경영학과

데이터를 이해하고 논리적이며 효율적으로 표현하는 방법을 학습할 수 있다. 다양한 소프트웨어(MS Office의 excel, PPT, R, Python 등)를 활용해 실습하며, 여러 데이터를 파악하고 처리하는 능력을 키울 수 있다. 이와 같은 기초 분석을 수행한 결과를 PPT 등을 활용해 발표하며 효과적으로 의사소통하는 역량을 높일 수 있다.

경영 통계와 데이터 과학의 핵심내용과 통계적 분석방법을 배울 수 있다. 자료의 특성을 분석하고 요약하는 기술통계, 표본의 정보를 통해 모집단의 특성을 추측하는 추론통계, 통계를 활용하는 사회과학 방법론(회귀분석 등), 데이터 과학(빅데이터, 감성 분석 등)의 지식을 학습할 수 있다. 특히 통계분석이 가능한 프로그램(excel, R, Python 등)을 활용하여 데이터 분석과 해석, 판단 능력을 확보할 수 있다.

생산운영관리(생산경영)과 서비스 운영관리(서비스 경영)의 기본개념과 최신의 경영경제 이슈(스마트 팩토리, 제조혁신, 생산-서비스 융합 등)를 학습할 수 있다. 생산, 제조분야와 서비스와 융합 분야의 기업과 산업을 성공 및 실패 사례를 통해 지식을 적용하고 시사점을 파악하는 능력을 높일 수 있다.

과학기술의 혁신을 이해하며, 비즈니스 관점에서 경영하는 방법과 지식을 학습할 수 있다. 더불어, 최근의 기술경영 및 경제 관련 사례(예: 인공지능, 빅데이터, 블록체인, NFT, 메타버스 등)를 분석하고 시사점을 도출하는 역량을 키울 수 있다.

일상과 비즈니스에서 정보를 활용한 선택과 의사결정의 핵심개념과 대표사례를 학습할 수 있다. 먼저, 행동경제학과 넛지(Nudge) 등 생활 속 의사결정의 주요 개념과 지식을 이해할 수 있다. 더불어, 협업 필터링(Collaborative filtering)과 추천 시스템, 데이터를 활용한 여러 계량적 의사결정 방법(예: AHP, ANP 등 다목표-다기준 결정) 등을 배울 수 있다. 최근의 일상 및 경영경제적 이슈나 사례를 선정해서 직접 분석하거나 실습하면서, 정보와 지식의 활용과 경영경제적 시사점을 이끌어 내는 능력을 갖출 수 있다.

기본적인 전략 분석

250만원, 고반발 금장 아이언세트, '60만원'대 72% 할인 판매!

최근 마케팅에서의 화두는 단연 컨셉과 차별화이다. 마케팅 전략 수립의 기본적인 틀인 ‘환경분석->STP 전략수립->4P Mix 전략수립’이 정형화되어 가는 상황에서 이를 모두 아우르는 컨셉과 이를 뒷받침하는 차별화는 히트상품이 갖춰야 할 필수적인 요소로 자리잡아가고 있다. 이 중 차별화 전략에서 가장 많이 범하는 오류는 무엇이며, 마케팅 전략에서 차별화 전략이 갖춰야 할 기본적인 요소는 무엇인지 알아본다. 글_양용훈 / CEO리포트 경영사례분석가

뛰어난 CEO들을 살펴보면 분명히 무엇인가 다른 점을 발견할 수 있다. 또한 성공한 히트상품을 조사해보면 기존상품과는 다른 점을 발견할 수 있다. 이렇게 다른 점을 다시 말하면 `차별화`라고 할 수 있다. 그렇지만 마케팅에서의 차별화 전략은 단순히 다르다는 의미를 뛰어 넘는다. 그렇기 때문에 차별화 기본적인 전략 분석 전략을 수립하는데 있어 대다수의 마케터들은 고민에 빠질 수밖에 없다. 먼저 성공적인 차별화 전략 수립을 위해서 마케터들이 가장 많이 실수를 저지르는 유형에 대해서 알아보도록 하겠다.

차별화 전략에서 범하기 쉬운 실수 3가지

효과적인 차별화 전략을 실시하기 위해 특별한 원칙은 없다. 간간히 마케팅 관련 서적에서 차별화 전략에 대해서 언급을 하고 있지만 STP전략처럼 정형화된 모델은 없다. 그렇기 때문에 차별화 전략 수립의 필요성을 느끼면서도 전략 수립에 있어서 간과하거나 전체적인 전략과의 통일성을 유지하지 못하는 경우가 많다. 이때 가장 많이 범하는 실수는 다음과 같다.

첫째, 제품의 2차 속성으로 차별화를 하는 것이다.

소비자들이 제품을 구매하거나 고려대상에 포함시키는 이유는 바로 제품의 1차 속성 때문이다. 1차 속성이 가장 뛰어난 제품을 먼저 구매하게 되며 이 제품의 뛰어난 속성이 다른 상품에 대한 기준점이 되어버린다. 이런 상황에서 제품 구매속성에서 전혀 중요하지 않은 컬러, 향기, 포장지 등 2차 속성을 강력한 차별화 요소로 내세울 경우 실패할 가능성이 매우 높다.

예를 들어 몇 년 전에 ‘콜라는 검은색이다’는 명제에 대항해서 노란색 콜라를 출시했던 해태제과의 콤비콜라는 결국 실패하고 말았다. 한 순간 소비자들의 시선을 붙잡고 일시적인 매출은 있었지만 음료수를 구매하는 소비자들이 고려하는 1차 속성을 뛰어난 맛이었으며 색깔은 거의 고려가 되지 않는 2차 속성이었음에도 불구하고 이를 전면에 내세웠기 때문에 실패할 수밖에 없었다.

둘째, 뚜렷한 특성이 없는 일반적인 품질의 차별화를 하는 것이다.

소비자들의 구매 고려 대상에 놓여있는 3∼5가지 제품에서의 품질 차별화는 거의 불가능한 것이다. 기술력의 진보가 거의 비슷한 상황이고 신제품의 핵심능력을 파악하여 비슷한 제품을 단시간 내에 출시하는 것이 그리 어렵지 않기 때문에 전반적인 품질에 대해서는 거의 차이가 없다고 볼 수 있다. 그럼에도 불구하고 단순히 ‘저희 제품이 더욱 뛰어납니다’라는 품질 차별화 전략을 실시할 경우에 이는 실패할 확률이 높다.

이동통신에서 후발주자인 016 KTF와 019 LGT는 011보다 품질이 뛰어나다고 수십 차례 마케팅 공격을 하였음에도 불구하고 소비자들은 여전히 011 SKT의 품질이 뛰어나다고 믿고 있다. 또한 펩시콜라가 블라인드 테스트를 통해서 맛의 우수성을 증명하기는 했지만 여전히 2위를 할 수밖에 없는 것은 많은 것을 시사해 준다.

셋째, 가격의 차별화에 집착하는 것이다.

구매에 있어 가격은 그 어떤 상품일지라도 중요한 속성에 해당한다. 그렇지만 가격은 여러 가지 고려 요인 중의 단 하나이며 마케팅 전략에 있어서도 마케팅믹스 요소 중 단 하나임을 명심해야만 한다. 전체적인 전략수립 중 고가격 혹은 저가격을 차별화 전략 중 하나의 요소로 선택해서 진행하는 경우가 아니라면 이는 실패할 가능성이 매우 높다. 오히려 저가격을 차별화로 내세웠을 때 소비자는 제품에 대해 의문의 시선을 보낼 가능성이 매우 높다.

K마트는 경쟁사인 월마트에 대항해 마케팅 전략을 가격 중심 차별화 전략으로 접근하였다. 실제로 K마트의 가격은 월마트보다 저렴했지만 `Every Day Low Price`라는 명제를 차지하고 있는 월마트를 이길 수 없었다. 이와 반대로 이마트가 국내 소비자 중심의 쇼핑 형태를 분석한 할인점으로 성공한 것을 보면 결코 가격의 차별화는 성공할 가능성이 높지 않다라는 것을 알 수 있다.

또한 지속적인 가격의 차별화는 단기간의 매출 신장을 보장해 줄지는 모르지만 지속적인 경쟁에서는 싸구려 제품이라는 인식을 심어줄 수도 있기 때문에 굉장히 위험한 차별화 전략임을 명심해야만 한다.

성공적인 차별화 전략을 위한 3가지 원칙

그렇다면 성공적인 차별화전략을 실시하고 전체적인 마케팅 전략 속에서 살아있는 차별화 전략을 실시하기 위해 어떻게 해야만 할까? 이를 위해서는 다음과 같은 3가지 원칙을 지켜야만 한다.

첫째, 차별화 전략은 마케팅 전략 전체에 완전히 녹아 있어야 한다.

서두에 언급하였듯이 차별화 전략은 마케팅 전략의 일부분이 아니다. STP전략을 통하여 차별화 전략이 세워졌다고 할지라도 4P Mix전략에서 이를 뒷받침해주지 못한다면 이는 완벽한 차별화 전략이라고 할 수 없다. 또한 4P Mix전략(Price, Place, Promotion) 중 하나만 차별화 전략이 실시된다면 이것 또한 완벽한 차별화 전략이라고 할 수 없다. 성공적인 차별화 전략이 되기 위해서는 세밀한 환경분석을 통하여 수립이 된 STP전략을 기반으로 해서 전체적인 차별화 전략을 수립한 후에 이를 4P Mix전략에서 적절히 수행되어야만 한다.

성공사례로 자주 등장하는 히트제품을 살펴보면 어느 하나에서만 차별화 전략을 실시했기 때문에 성공한 것이 아니라 마케팅 전략 전반에 있어서 기본적인 전략 분석 일관성 있는 차별화 전략을 실시했기 때문에 성공한 것임을 알 수 있다.

예를 들어 만도의 ‘딤채’를 살펴보면 쉽게 알 수 있다. 딤채는 환경분석을 통해서 김치냉장고라는 차별화 된 제품시장을 파악했고, SWOT분석을 통해 에어컨기술의 강점과 신세대주부의 김치냉장고 니즈를 파악할 수 있었다. Targeting전략을 통해서 강남거주 30∼40대 중산층 이상의 전문직 여성을 타겟팅 하였으며, Positioning전략을 수립하면서 국내 최초의 김치전문 냉장고라는 포지셔닝전략을 수립하였다.

이러한 차별화전략은 4P Mix전략 중 Product 부분에서 최고의 에어컨기술이 사용된 김치숙성 및 보관전문 냉장고를, Price 부분에서 소비자조사 결과보다 훨씬 높은 100만원 정도의 고가격을 선택하였으며, Place 부분에서는 고급백화점 중심의 유통전략을 택하였고, Promotion에서는 당시에는 생소한 입소문 마케팅과 체험 마케팅을 적절히 활용하여 전체적으로 차별화 전략을 유지해 나갔다. 만약 가격에 대해 저가격으로 차별화를 했거나 프로모션 부분에서 단순히 광고만을 했었다면 딤채의 성공은 보장하지 못했을 것이다.

둘째, 차별화 전략은 고객중심의 사고에서부터 시작되어야 한다.

마케터들이 차별화라는 단어에 집중하면서 생기게 되는 오류가 차별화를 위한 차별화 전략을 세우게 되는 경우이다. 이는 고객이 요구하지도 않았음에도 불구하고 기술력을 맹신한 차별화로 그 결과가 나타나는 경우가 대표적이다. 예를 들어 포털사이트에서 1년 단위로 메인 페이지에 대한 리뉴얼을 단행하면서 다른 사이트와 차별화를 내세우는데 이는 결코 고객이 원해서 리뉴얼을 실시하는 것이 아니라는데 문제가 있다.

차별화 전략에 성공하기 위해서는 무엇보다도 정확한 환경분석이 필요하다. 그리고 이러한 환경분석을 바탕으로 본 제품의 타겟층이 느끼는 제품선택의 중요요소 중 최소 3번째 안에 드는 요소를 가지고 차별화 시켜야만 한다. 하이트맥주의 성공은 고객이 요구하는 원료의 깨끗함을 적절하게 차별화 시켰기 때문에 성공을 한 것이며, 오럴비 인디케이터 칫솔은 고객이 언제 칫솔을 바꾸는 것이 좋을지에 대해서 알려주었기 때문에 성공한 것이다.

차별화 전략을 실시할 때는 고객이 구매에 있어 중요하게 생각하지 않은 것을 가지고 차별화를 시도해서는 안 될 것이다. 예를 들어 고객에게는 별로 필요 없는 기능을 추가시켜 놓고 이를 이유로 가격을 높게 받는다면 이 제품은 시장에서 외면을 받게 될 것이다. 결국 차별화 전략이 성공하기 위해서는 고객에게 어떤 혜택이 돌아가며 어떤 가치를 전해줄 수 있는지에 대해 초점을 맞추어서 차별화 전략을 실시해야만 한다.

셋째, 차별화 전략은 본원적인 한 가지라도 완벽하게 차별화만 시키면 된다.

신제품을 출시하면서 마케터들은 기존의 제품과 무수히 많은 점에서 다르다는 것을 장점으로 내세운다. 이런 차별화를 고객이 제대로 기억할 수 있을까? 대부분의 고객들은 신제품을 구매하기 위해서는 기존의 제품에서 불편했던 단 1∼2가지가 해결된 신제품을 구매하는 습성이 있다. 완벽히 다른 제품에 대해서 구매를 꺼리는 습성이 있기 때문이다.

자일리톨껌은 1990년 말에 맨 처음 출시가 되었다가 실패하였고 다시 약통 모양으로 포장을 바꾸면서 충치예방 껌으로 차별화 전략을 실시하여 히트상품이 되었다. 환경문제가 대두되었을 때 한 회사에서 친환경 페인트를 출시하였고 마케터는 연구결과 한 성분이 포함이 될지라도 아토피 방지에는 거의 영향을 끼치지 않는다는 결과를 얻어서 고민했지만 아토피 방지 원료가 포함되었다는 것을 집중적으로 부각시켜서 상당히 성공한 제품이 되었다.

레티놀 성분이 거의 미량이기 때문에 피부에 큰 영향을 미치지 않음에도 불구하고 레티놀 함유 화장품으로 차별화를 하여 히트상품이 된 것을 보더라도 결코 많은 것에 차별화를 둘 필요 없이 본원적인 것 하나만 차별화 해도 성공할 수 있는 것이다.

결국 차별화 전략이 성공하기 위해서는 고객 중심의 단 하나의 차별화 요소를 파악하여 하나의 개별적인 전략이 아니라 마케팅 전략의 전체에 융화가 되어서 실시되어야 함을 알 수 있다.(CR)

VOL. 03

데이터 마이닝(Data mining)이란 대량의 데이터에서 통계적 규칙이나 패턴을 찾아내고, 찾아낸 정보·패턴을 다양한 형태로 활용하는 기술을 의미한다. Neflix의 협업 필터링(collaborative filtering)을 활용한 영화 추천시스템(recommendation)과 같은 ‘개인화 마케팅’ 분야에서 가장 활발하게 활용되고 있으며, 최근 들어 사회 변화 예측 및 유망기술 예측 등의 분야로 적용이 기본적인 전략 분석 확대되고 있다. 객관적 데이터에 기반을 둔 기술 예측은 새로운 기술의 등장 및 발전 속도가 급격히 빨라짐과 더불어 중요성이 점차 증대되고 있으며, 이에 따라 데이터 마이닝을 이용한 기술 예측, 유망기술 발굴 및 R&D 기획 방법론에 대한 연구가 활발하게 진행되고 있다. 본 이슈 페이퍼에서는 텍스트 마이닝(Text mining)을 기본적인 전략 분석 기본적인 전략 분석 활용한 특허 분석 및 기술 개발 방향 예측·탐색에의 적용 가능성에 대해 검토해 보고자 한다.

데이터 마이닝의 기본 개념 및 분석 방법론(Process)

데이터 마이닝은 대량의 데이터에서 유용한 패턴, 인과관계 또는 상관관계를 찾아내는 과정으로, 통계학, 컴퓨터공학 및 기계 학습(machine learning) 3가지 분야가 상호 연계(interdisciplinary)된 기술이라 할 수 있다. 통계학적 관점에서는 데이터에서 통계적 모델을 구축하는 작업으로 정의되고, 컴퓨터 공학 관점에서는 알고리즘의 문제로, 기계학습 관점에서는 기계 학습과 유사어(synonym)로 이해되고 있다. 세 가지 분야에서 서로 다른 관점으로 바라보고 있지만, 결론적으로는 대량의 데이터에서 새로운 지식을 발견(knowledge discovery)하기 위한 분석 과정(analysis step)으로 정의할 수 있다.

[그림1] 데이터 마이닝 프로세스

데이터 마이닝의 일반적인 프로세스를 살펴보면, 해결하고자 하는 과제 및 데이터 마이닝의 목적을 정의하고, 이에 적합한 데이터를 선정한 후, 데이터 마이닝에 적절한 형태로 데이터를 전처리하고, 통계적인 방법을 통해 데이터들을 모델링함으로써, 데이터 내에 잠재된 패턴 및 데이터 간 상관관계를 찾아내어, 이를 목적에 맞게 활용하는 단계로 이루어진다. 예를 들어 설명하면, 최근 개발되고 있는 신기술 개발 트렌드를 알고 싶다면, 해당 기술의 논문 또는 특허 모집단을 선정·수집하고, 컴퓨터가 인식할 수 있는 형태로 논문·특허의 텍스트 데이터를 정비하여 출현 빈도가 높은 기술 용어, 빈도는 낮지만, 특징적인 기술 용어 및 함께 등장하는 기술 용어들을 추출함으로써, 기술 트렌드를 유추하는 과정을 거치게 되는 것이다.

데이터에서 통계적 규칙·패턴을 찾아내는 과정, 즉 데이터 모델링(Data Modeling)은 데이터 요약(Summarizing data)특징 추출(Feature extraction)의 크게 2가지로 구분될 수 있다.

데이터 요약(Summarizing data)은 대푯값으로 데이터를 요약하는 것과 유사한 데이터끼리 그룹을 지어 나타내는 클러스터링(clustering)으로 구분된다. 대푯값을 이용한 데이터 요약의 두 가지 사례를 [그림 2]에 나타내었다. [그림 2](a)는 대푯값을 이용한 데이터 요약의 가장 기본적인 형태로, 데이터의 평균 및 표준편차를 이용하여 데이터의 분포를 나타내는 것이다. [그림 2](b) 클러스터링의 사례를 나타낸 것으로, 클러스터란 비슷한 특성을 갖는 데이터 집단을 의미한다. 클러스터링에 의한 데이터 대표하는 각 클러스터를 대표하는 중심값(centroid of cluster)과 클러스터 내의 개별 데이터로부터 중심값 간의 평균 거리로 데이터 분포를 나타내는 방법이다.

[그림2] Summarization of Data

특징 추출(Feature extraction)이란 주어진 데이터 세트에서 식별 가능한 본질적인 정보, 즉 특징(feature)을 추출하여, 보다 간결하게 데이터·패턴을 표현하는 과정을 의미한다. 기계 학습(machine learning), 패턴 인식(pattern recognition) 및 이미지 처리(image processing) 분야에서 대량의 입력 데이터(예를 들어 이미지의 픽셀)로부터 반복적이고 무의미한 데이터들을 제거하여, 이후의 기계학습 등의 작업을 차원 감소(dimension reduction)된 데이터만을 활용하여 수행하도록 하는 과정이라 할 수 있다.

[그림3] 특징 추출(Feature Extraction) 사례

[텍스트 마이닝이란?]

텍스트 마이닝은 입력 데이터가 문서 또는 웹 등에 나타나는 텍스트로, 인간이 사용하는 자연어를 처리(natural language processing)하여 정보를 추출하는 과정을 의미한다.

텍스트 마이닝의 첫 번째 과정은 분석 대상 데이터, 즉 텍스트 데이터를 수집하여 모집단을 구축하는 것인데, 논문, 특허, 웹 뉴스 등 대량의 텍스트 기본적인 전략 분석 문서들을 모아놓은 집합을 corpus라고 명명한다. 개별 문서들을 구성하는 최하의 텍스트 단위는 단어(word, token)이며, 두 개의 연속된 단어를 이중자(bigram)라 한다. 이중자 중에서 일반적으로 쓰는 연속된 단어(예를 들어 ‘the wine’)가 아닌 이중자, 예를 들어 ‘red wine’과 같이 특정한 의미를 가진 이중자는 연어(collocation)라 명명한다. 이중자는 단순히 연속해서 존재하는 두 단어를 의미하는 반면, 연어는 문맥적인 의미(context)를 가진다는 점에서 차이를 갖는다. [그림 4]에 corpus, word/token, bigram 및 collocation의 사례를 나타내었다.

[그림4] 텍스트 마이닝 관련 기본 용어

텍스트 마이닝을 통해 정보를 얻을 수 있는 가장 기본적인 단위는 단어(word, token)이고, 텍스트를 구성하는 단어들 중에서도 의미가 있는 단어, 즉 해당 문서의 주제(theme, topic)를 나타내는 단어를 키워드(keyword)라 할 수 있다. 텍스트 마이닝의 가장 기초적인 형태는 텍스트 문서로부터 키워드를 뽑아 그 문서 또는 문서의 집합이 나타내는 주제를 유추해 보는 것이다. 이러한 키워드를 뽑기 위한 텍스트 마이닝의 첫 단계는 텍스트 문서를 단어 단위로 쪼개어 어떤 단어들이 문서에 포함되어 있는지를 살펴보는 것이라 할 수 있는데, 텍스트 문서의 모든 문장을 개별 단어 단위로 쪼개는 과정을 토큰화(tokenize)라고 부른다.

문서의 모든 문장을 토큰화하여 단어들을 모았다고 가정하자. 그렇다면 문서의 주제를 나타내는 단어는 어떻게 찾을 수 있을까? 가장 쉽게 생각할 수 있는 것이, 토큰화를 통해 단어들을 모은 후, 각 단어들의 출현 빈도를 계산하여 문서에 여러 번 등장하는 단어를 살펴보는 것이다. 그렇다면 출현 빈도가 높은 단어들이 항상 중요한 단어, 즉 키워드라 할 수 있을까? 실제로는 예상과 정반대로, 출현 빈도가 높은 단어들은 의미가 없는 단어들, 예를 들어, 조사, 관사/정관사 등 문장을 구성하기 위해 항상 쓰이는 단어들이 빈도가 높게 나타난다. [그림 5]에 미국 특허의 초록(abstract)을 토큰화하여 단어들의 출현 빈도를 계산한 결과를 나타내었다. [그림 5]에서 알 수 있듯이 가장 출현 빈도가 높은 단어는 정관사 ‘the’로, 해당 특허의 주제와는 무관한 단어임을 알 수 있다.

[그림5] 토큰화 및 개별 단어의 출현빈도 측정 사례

위의 사례로부터 단순히 출현 빈도가 높은 단어들을 찾아내는 것은 텍스트 문서의 주제어, 즉 키워드를 찾고자 하는 목적에는 적절하지 않음을 알 수 있다. 출현 빈도에 근거하여 주제를 나타낼 가능성이 있는 단어를 추려내는 방법으로, TF-IDF라는 통계적 수치가 가장 일반적으로 사용되고 있다. TF-IDF란 ‘Term Frerquency-Inverse Document Frequency’의 줄임말로, 여러 문서로 이루어진 문서 군에서 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. TF(단어 빈도, term frequency)는 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 나타내는 값으로, 이 값이 높을 수록 문서에서 중요하다고 생각할 수 있다. 하지만 단어 자체가 문서군 내에서 자주 사용되는 경우, 이것은 기본적인 전략 분석 그 단어가 흔하게 등장한다는 것을 의미한다. 이것을 DF(문서 빈도, document frequency)라고 하며, 이 값의 역수를 IDF(역문서 빈도, inverse document frequency)라고 한다. TF-IDF는 TF와 IDF를 곱한 값이다. IDF 값은 문서군의 성격에 따라 결정된다. 예를 들어 '원자'라는 낱말은 일반적인 문서들 사이에서는 잘 나오지 않기 기본적인 전략 분석 때문에 IDF 값이 높아지고 문서의 핵심어가 될 수 있지만, 원자에 대한 문서를 모아놓은 문서군의 경우 이 낱말은 상투어가 되어 각 문서들을 세분화하여 구분할 수 있는 다른 낱말들이 높은 가중치를 얻게 된다. 문서군내의 단어 들별로 TF-IDF 값을 비교했을 때, 높은 TF-IDF값을 갖는 단어들이 문서의 주제를 나타낼 가능성이 높은 것으로 판단할 수 있다. [그림 6]에 TF-IDF의 개념을 도식적으로 나타내었다.

[그림6] TF-IDF의 개념

대량의 문서로 구성된 문서군을 텍스트 마이닝을 통해 의미를 추출하는 방법에는 위에서 기술한 키워드 추출 외에도 의미를 갖는 두 개의 연속 단어(이중자), 즉 collocation을 추출하여 의미를 유추하는 방법도 적용이 가능하다. Collocation은 이중자 중에서, 일정 빈도 이상으로 함께 쓰이는 단어의 조합으로, 텍스트의 의미(context)를 나타낼 가능성이 높은 두 단어의 조합을 의미한다. 따라서 collocation 분석을 통해 개별 단어의 tf-idf 값에 기반한 키워드 분석만으로는 유추하기 어려운 문맥적 의미를 유추할 수 있다.

단어나 이중자 분석에서 한 걸음 더 나아가 대량의 문서에 존재하는 주제를 예측하는 방법도 지속적으로 연구 및 활용되고 있는데, 그 중 대표적인 것이 토픽 모델링(Topic Modeling)이다. 토픽 모델링이란, 수집된 문서에 대해 각 문서에 어떤 주제들이 존재하는지를 찾아내는 기계학습(machine learning)의 한 종류로, 자주 함께 나타나는 단어들을 클러스터링 함으로써, 잠재된 주제(topic)를 유추하는 것이라 할 수 있다. 토픽 모델링에 있어서 가장 기본적인 가정(assumption)은 ‘Bag-of-Word’ model 개념으로, 텍스트 문서는 단어의 뭉치(bag)로, 문법이나 단어의 순서는 토픽과는 무관하다는 개념이다. 예를 들어, ‘I like to watch movies.’라는 문장을 단어 단위로 쪼개면 (I, like, to, watch, movies)가 되는데, 개별 단어의 순서가 바뀐 (like, movies, I, watch, to)도 같은 단어의 뭉치라는 것이다.

문서군의 토픽을 유추하는 통계적 방법에는 LSI(Latent Semantic Indexing), pLSA(Probabilistic Latent Semantic Analysis), LDA(Latent Dirichlet Allocation)이 있는데, LSI와 pLSA의 단점을 보완한 LDA 기법이 가장 많이 사용되고 있다.

LDA 기법은 문서를 여러 개의 토픽의 뭉치(mixture of topics)로, 각 토픽은 개별 단어들의 확률적 뭉치/분포(probabilistic distribution of words)로 간주한다. 토픽 모델링을 개념적으로 나타내면 [그림 7]과 같이 나타낼 수 있다. [그림 7]에 블랙박스로 나타낸 부분이 문서를 처리하는 통계 모형·알고리즘을 의미하는 것이고, 가장 많이 활용되는 LDA에 해당하는 부분이다.

[그림7] 토픽 모델링(Topic Modeling)의 개념

LDA를 이용한 토픽 모델링의 5단계 주요 과정을 [그림 8]에 나타내었다. 분석 대상인 텍스트 문서들을 개별 단어 단위로 쪼개고(tokenization), 일반어(stopwords)를 제거하는 전처리 과정(pre-processing)을 거친 후, 단어들의 집합(bag-of-words)을 구성하여 LDA를 적용하여 유사한 단어들을 주제로 클러스터링한다.

[그림8] 토픽 모델링(Topic Modeling)의 과정

LDA는 개별 단어들을 토픽별로 무작위 할당하고, 특정 문서가 해당 토픽을 포함할 확률 및 특정 단어가 특정 토픽에 해당할 확률을 계산하고, 단어를 재샘플링하여 상기 확률을 계산하는 과정을 반복(iteration)하는 알고리즘이다. LDA에 의한 토픽 모델링의 결과가 얻어지면, 분석자가 토픽 또는 단어를 무작위로 섞어서 평가하는 Human-in-the-loop 방법과 cosine similarity를 측정하는 방법을 이용하여 평가(evaluation)하고, 클러스터링된 토픽의 정확도가 기본적인 전략 분석 낮다고 판단되면, iteration 횟수, 토픽의 개수 등 변수를 바꾸어서 다시 모델링을 수행한다.

텍스트 마이닝을 활용한 특허 분석 사례 연구 및 기술 동향 예측

신기술에 대한 수요(needs) 또는 관심은 최신 논문 및 특허에 고스란히 반영되어 있으며, 논문 및 특허를 분석함으로써 신기술 개발 방향 및 주요 이슈 등을 예측할 수 있다. 본 사례연구에서는 미래형 주방(Smart kitchen)에 대한 소비자들의 수요가 어떻게 진화하고 있는지, 그리고 이에 대응하기 위해 어떤 기술이 연구개발되고 있는지 살펴보기 위해, 주방(kitchen)과 관련된 특허들을 대상으로 텍스트 마이닝을 적용, 유의미한 키워드 및 키워드 진화(temporal evolution), 미래형 주방과 관련이 있는 것으로 보이는 단어들의 문맥적 의미를 분석하였다.

[키워드 분석을 통한 트렌드 예측]

[그림 9]에 미래형 주방에 대한 특허를 대상으로 한 키워드 분석 절차를 나타내었다. 텍스트 마이닝은 1990년부터 2016년까지 26년간 출원·등록된 미국 및 유럽 특허 2,000건의 초록(abstract)을 대상으로 수행하였다.

[그림9] 특허 대상 텍스트 마이닝 및 키워드 도출 절차

[그림 9]에 나타낸 절차 중, 4번째 단계는 본 사례 연구에서 특별히 추가된 단계로, 분석 대상인 특허에서 관용적으로 사용되는 일반적인 표현들을 제거하기 위한 단계이다. 특허 초록에는 invention, method, provide 등의 단어들이 가장 일반적으로 많이 사용되기 때문에, [그림 9]의 3단계에서 얻어진 단어 빈도수를 검토하여, 상기 관용어들을 따로 분류하여 제거함으로써 분석주제인 미래형 주방과 관련된 기술 용어, 수요에 기본적인 전략 분석 관련된 단어들만 추출하고자 하였다.

[그림 10]에 도출된 키워드의 빈도수 분포 및 1990년 이후 시기별 키워드의 빈도수 변화를 워드 클라우드로 나타내었다. 워드 클라우드 상의 단어의 크기 차이는 빈도수를 의미하는 것으로, 굵고 크게 표현된 단어가 출현 빈도가 높은 단어를 의미하는 것이다.

[그림10] 키워드 빈도수 분포 및 시대별 키워드 진화

[그림 10]에 나타낸 키워드 빈도수를 살펴보면, “intelligent”라는 단어가 특허 상에 가장 많이 사용되고 있음을 알 수 있고, sensor, refrigerator, monitoring, safety 등의 단어가 다수 출현하고 있음을 알 수 있다. 또한 wireless, communication, network, mobile, alarm, smart, rfid, security 등의 단어들도 자주 나타나고 있는데, 이러한 단어들의 공통점을 생각해보면, 대부분 IT 기술을 활용한 모니터링, 센싱, 통신 등의 개념이라 할 수 있다. 즉, 주방과 관련하여 일반적으로 생각할 수 있는 food, cooking 등의 단어보다 상기 단어들의 빈도수가 높다는 사실은 IT 기술과 접목된 형태의 진보된 주방에 대한 관심이 높게 나타나고 있음을 반영하는 것이라 예측할 수 있다. 1990년 이후 시대별 키워드 진화를 살펴보면, 이러한 특징은 더욱 두드러지게 나타난다. 1990년대에 출원된 특허에 가장 많이 등장한 단어는 food, nutritional, dietary 등 음식, 영양과 관련된 용어인데 비해, 2000년 이후 출원된 특허 상에는 sensor, detection이라는 단어가 가장 높은 빈도로 등장하고, 2010년 이후에는 intelligent, refrigerator 및 sensor가 가장 많이 등장함을 알 수 있다. 또한, 2000년 이후 wireless, communication, mobile과 같은 IT 기술과 관련된 단어들이 등장하고 있음을 알 수 있다. 이러한 결과로부터, 기존의 전통적인 주방에 IT 기술과 융합되어 통신, 모니터링 등이 가능한 진보된 주방에 대한 기술적 관심, 즉 기술개발이 증가되고 있음을 예측할 수 있다.

[Context 분석을 통한 기술 동향 분석]

개별 키워드 분석으로도 신기술 동향을 예측할 수 있지만, 개별 키워드들이 어떤 문맥에서, 어떤 다른 단어들과 함께 나타나는지를 분석함으로써, 좀 더 명확한 예측이 가능할 수 있다. 예를 들어, 키워드 분석 결과에서 가장 높은 빈도로 나타난 ‘intelligent’와 같은 단어들은 어떤 문맥에서 사용되었는지를 분석하면, 어떤 개념, 어떤 기술이 개발되고 있는지 유추할 수 있을 것이다. 이러한 기본적인 전략 분석 문맥 분석의 방법의 하나로, 함께 등장하는 단어(collocation)를 분석한 결과를 [그림 11]에 나타내었다.

[그림11] Collocation 분석 결과

먼저, 가장 빈도수가 높은 키워드 ‘intelligent’가 어떤 의미로 쓰였는지를 [그림 11]의 결과로부터 확인할 수 있는데, intelligent refrigerator, intelligent home과 같이 지능화된 냉장고 및 집에 대한 관심을 반영하고 있음을 알 수 있다. 시대별로 살펴보면, 1990년대에는 food menu, smoke alarm 등의 collocation이 주로 나타난 반면, 2000년 이후 intelligent refrigerator, safety module, sensor array, remote sensor 등 IT 기술과의 융합을 의미하는 collocation이 등장하고 있음을 뚜렷하게 알 수 있다. 또한 2010년 이후에는 Internet of Things(IoT), intelligent home, wireless communication 등이 등장하는 것으로부터 주방 및 집에 internet, 통신 기술들이 융합되어 보다 편리하고 스마트한 형태로 발전되어 가고 있음을 나타내고 있다. 실제로 2016년 상반기, 삼성전자는 IoT 기능을 적용, 요리와 식재료 주문 및 보관기간 관리까지 가능한 스마트 냉장고를 출시했는데, 이는 특허에서 나타나는 키워드 및 문맥 분석이 기술 개발 흐름/방향을 예측할 수 있음을 나타내는 대표적인 사례라고 할 수 있을 것이다.

함께 나타나는 두 단어, 즉 collocation을 추출하여 분석함으로써, 개발하고자 하는 관심 기술 및 개발 방향에 대한 좀 더 명확한 예측이 가능함을 상기 사례로부터 확인할 수 있는데, collocation에 국한하지 않고, 관심 대상인 특정 키워드를 포함하는 문장을 추출하여 해당 단어의 전후 문맥적인 의미를 살펴보는 방법을 활용할 수도 있다. 가장 출현 빈도가 높은 키워드 ‘intelligent’를 포함하는 문장을 추출한 결과를 [그림 12]에 나타내었다. 높은 빈도로 동시 출현한 ‘intelligent refrigerator’ 이외에도, intelligent appliances, intelligent sensor system, intelligent thermostat, intelligent food receptacles, intelligent food safety management card, intelligent bio-preservation system, intelligent 기본적인 전략 분석 temperature sensing spoon 등 다양한 주방 기기/용품들에 대한 지능화, 스마트화에 대한 기술 개발이 이루어지고 있음을 확인할 수 있다.

[그림12] 특정 키워드를 포함하는 문장의 문맥 분석

본 고에서는 텍스트 마이닝에 대한 간략한 소개와 더불어 텍스트 마이닝 기반의 특허 분석을 통해 신기술에 대한 수요·관심(needs) 및 기술 개발 방향을 예측하는 방법에 대해 살펴보았다. 텍스트 마이닝을 활용하여 대량의 문서 데이터를 분석함으로써, 분석자의 주관적인 의견을 배제한 객관적 정보를 빠른 시간 안에 효율적으로 추출해 낼 수 있다. 대량의 논문, 특허 등의 텍스트 문서로부터 유의미한 키워드들을 추출하고, 이를 기반으로 문맥 분석 및 동시 출현 단어를 분석하여 시장에서 수요가 높은 기술을 예측하거나, 실제 기술이 개발되는 동향, 진화 방향을 예측하는데 효과적인 방법으로, 연구 단계 초기의 거시적 트렌드 예측 또는 두 가지 이상의 기술이 융합된 융합 분야의 기술을 예측하는데 유용하게 활용될 수 있을 것이라 판단된다. 또한, 기계학습 방법을 도입하여, 대량의 텍스트에 잠재되어 있는 주제(topic)들을 추출·유추하거나 문서간의 유사도(similarity)를 기반으로 대량의 문서를 주제별로 분류(classification)하는 시스템에도 확장 응용이 가능한 방법으로, 향후 기술 예측이나 기술 기획, 소비자 수요 파악 등으로 그 활용범위가 크게 확장될 것으로 기대된다.

한국특허전략개발원 "KISTA 웹진"은 반기별 발행되는 온라인 소식지 입니다.

Copyright(c) Korea Intellectual Property Strategy Agency, All right reserved.

디지털마케팅 전략과 글로벌 트렌드 기본적인 전략 분석 보고서 -KOTRA가 전하는 글로벌 디지털마케팅 전략-

디지털이니셔티브 그룹은 디지털마케팅 코리아 와 함께 코트라의 ‘디지털마케팅 전략과 글로벌 트렌드’ 보고서 발간을 진행하였습니다.

디지털마케팅전략 과 글로벌 트렌드 보고서는 디지털마케팅에 대한 경험과 노하우가 부족한 기업을 위한 가이드북 입니다. 기업의 해외시장 공략을 위한 디지털마케팅 전략 수립을 위한 기본적인 개념과 단계별 실행방안 과 실무에서 활용할 수 있는 다양한 팁들을 제공하고 있습니다. 더불어 KOTRA 현지 해외무역관에서 주요 국가별 디지털마케팅에 관한 동향과 진행사례를 함께 담고 있습니다. 글로벌 디지털마케팅을 어떻게 추진해야 하는지 고민하는 기업들에게 실용적이고 유용한 가이드가 될 것입니다.

PART1은 디지털마케팅에서 잠재고객을 정의하고 충성고객으로 이끌어 낼 수 있는 이론과 실천방법을 소개하고 있습니다. 고객을 유인하기 위한 디지털마케팅 콘텐츠 와 미디어(캠페인)활용방법과 마케팅의 효과측정하는 방법까지 제안하며, 나아가 독자가 실질적으로 활용할 수 있는 주요 소셜미디어(페이스북, 인스타그램, 유튜뷰)와 다양한 마케팅 Tool의 사용법도 함께 활용할 수 있습니다.

PART2는 해외진출 전략수립을 위해 필요한 주요 국가별 디지털마케팅 추진환경, 생생한 지역사례, 문화적인 특성과 정부제도 등 국가별 상이한 환경에서 디지털마케팅을 추진하기 위해 고려해야 하는 포인트를 소개하고 있습니다.

이 글 공유하기:

디지털전략 컨설팅회사인 디지털이니셔티브그룹(Digital Initiative Group)은 국내 주요기업들 대상으로 디지털혁신 및 전략추진에 필요한 디지털 트랜스포메이션, 비즈니스모델 혁신, 디지털 리테일 , 디지털마케팅, 온디맨드 서비스플랫폼 , 옴니채널&O2O 전략 관련 컨설팅, 자문, 리서치, 교육을 진행하고 있습니다.


0 개 댓글

답장을 남겨주세요