'2008/07'에 해당되는 글 2건

  1. 2008/07/10 웹분석에서 방문자의 구분
  2. 2008/07/10 웹분석 환경 구성요소 – 행위주체

방문자 구분의 기술적 방법

위 그림과 같은 인터넷 접속이용 환경에서 하나의 사용자가 동시에 2대의 컴퓨터를 사용하고, 하나의 데스크톱PC에서는 Explorer와 Firefox를 사용하며, Explorer의 경우 시작버튼을 눌러 새로운 Explorer를 실행시켜 동시에 2개의 Explorer 프로세스를 만든 이후 하나의 웹사이트에 모두 접속하였다면,

  • IP기반의 방문자 구분에서
    • 각 PC가 공인IP를 할당 받았다면 방문자는 2.
    • 각 PC가 사설IP로서 공인IP 한 개를 통해 방문했다면 방문자는 1.
  • 쿠키기반 방문자 구분에서
    • Explorer를 동시에 실행 중이라면, 4의 방문자.
    • Explorer를 한번 실행하고 종료한 후 다시 실행하였다면 쿠키값이 Explorer내에서 공유되었으므로 3의 방문자.
  • UUID 기반의 방문자 구분에서는
    • 사용자가 모두 웹사이트에 로그인 인증을 거쳤다면, 1명
    • Firefox에서만 인증을 거쳤다면, UUID기반의 방문자는 1명, 이외 방문자는 IP/쿠키등 다른 방문자 구분 방법에 종속적.

IP/쿠키/UUID 기반의 방문자 구분방법은 웹분석의 측정방법( 로그파일/페이지태깅/패킷스니핑 )과는 무관한 방문자의 구분 방법일 뿐 이다.

로그일/페이지태깅/패킷스니핑의 측정방법과 방문자 구분의 방법이 함께 고려될 경우에는 위와 같은 방문자수 구분의 왜곡요소와 더불어 다양한 문제가 발생한다.

사례를 단순화 하기 위해 1명의 방문자가 1대의 PC로 1개의 웹브라우저에서 1개의 Process로만 웹사이트를 1개월간 매일 이용하였을때, 1개월(30일)간의 순방문자수(특정 기간내에 중복방문을 제거한 순수 방문자수)의 측정을 하고자 한다면,

  • IP기반의 30일간 순방문자수
    • Raw Data(예: 로그파일)를 30일치를 모두 모아 두었다면 1명
    • Raw Data를 1일치씩 분석하여, 분석값을 누적합산하였다면 30명
    • 자유로운 기간에 대해 순방문자수를 계산하기 위해서는 Raw Data가 필요하다.
  • 쿠키기반의 30일간 순방문자수
    • 사전 정의된 순방문자수 기간일 경우1명
    • 사전 정의된 단위기간을 넘어설 경우 단위기간당 1명씩 누적 합계값
      예) 단위기간이 1일인 경우 30일간 순방문자수는 30 명.
      일반적으로는 주요 단위기간별로 사전정의를 해 놓는다.
    • 자유로운 기간에 대해 순방문자수 계산을 위해선, 역시 Raw Data가 필요하다.

하나의 방문자의 경우에는 위와 같은 경우와 같이 각각 정리되지만, 다수의 방문자에 대해 통계값을 처리하고자 할 경우에는 더욱 다양한 문제가 발생한다.

2002-2008 © Nativic & BizSpring, Inc.

Posted by nativic

웹분석 환경 구성요소 – 행위주체

웹분석 측정지표와 주변 요소들

앞서 설명에서 Metric은 측정항목 및 측정기준(측정법)으로 정의하였다, 이때 측정항목의 의미는 두 가지로 이해될 수 있다. 하나는 값을 나타내는 측정항목으로서 의미이고 또 다른 하나는 측정대상을 의미하는 항목이다. 즉, 측정지표(Metric)을 포괄적으로 설명하자면 "특정한 방법을 통해 특정 대상의 값을 측정하는 방법을 정의한 것" 이라고 할 수 있겠다.
이때 측정지표가 정의되기 위해서는 측정의 대상, 측정의 방법(주변 환경, 제한조건 등)이 필요하다.

이러한 주변요소들과 제한조건은 측정값에 대해 세분화(Segmentation)를 적용하는 하나의 차원(Dimension)이 되는데, 이를 '행위주체', '원인제공요소', '분석대상객체' 로 나누어 살펴 보기로 하고, 측정된 결과값은 '성과'로 구분하여 살펴 보기로 한다.


행위 주체

웹분석에서 행위주체라고 하면, 웹분석을 위한 다양한 측정 데이터를 생산해내는 원인을 제공하는 객체를 뜻한다. 웹분석에서 기본적인 행위주체는 '방문자'가 되겠다.
또한 웹분석의 측정에서 가장 중심이 되는 '방문(Visit/Session)'을 이루는 주체로서 매우 중요하다.


방문자

방문자의 정의와 제한조건

웹사이트에 클라이언트(웹브라우저)를 이용하여 방문한 방문자를 뜻한다. 하지만 인터넷환경에서 실제 방문자를 구분한다는 것은 웹사이트를 방문할 때 마다 로그인 인증을 새롭게 거치지 않는 이상은 불가능 하다. 한번 인증을 거친 클라이언트에 쿠키 및 IP등을 이용하여 표시를 한다고 하더라도 다음 방문시에는 실제 해당 방문자가 아닐 수 도 있다.
즉, 매번 방문에 사용한 클라이언트 프로그램과 실제 클라이언트를 조작하는 사람의 정보를 연결시키는 작업이 없는 이상 실제 방문한 사람을 구별하는 것은 불가능하다. 하지만, 이 경우에도 PC에서 자동화프로그램(Automator, 마우스행동 및 키입력을 반복적으로 자동 수행시키는 프로그램)을 이용할 경우에는 역시 올바르다고 볼 수 없다.
위와 같은 조건으로 인해 웹분석에서는 실제 사람이 이용하는 클라이언트를 하나의 방문자로 간주하여 분석을 수행한다. 이후 '방문자'라고 하면 '방문' 자체에 의미를 두고, 각 개인을 구별할 수 있는 식별자(회원ID등)를 고려하지 않은 상태에서 익명 및 회원 방문자를 구별없이 모두 포함하는 것으로 한다.


방문자의 종류

방문자는 실제 사람이어야 하지만, 사람을 구별하기 어려운 만큼 사람(방문자)이 사용하는 클라이언트를 방문자로 처리하는 경우에는 아래와 같이 방문자 클라이언트를 구별할 수 있다.

  • 실제 사람이 이용하는 인터넷 접근장치에 설치된 웹브라우저
    • 개인 PC 및 PDA등의 웹브라우저 : 인터넷익스플로러, 파이어폭스, 사파리 등
    • 핸드폰등에 설치된 모바일 웹브라우저
  • 웹사이트에 접근하여 컨텐츠를 획득해오는 로봇(스파이더)
    • 검색엔진 로봇(스파이더)
    • 웹사이트 스크래퍼(Scraper), 다운로드 에이전트(Webzip 등)

최근의 웹분석 동향은 실제 사람이 사용하는 클라이언트에 의한 방문만을 방문자 측정대상으로 하고, 검색엔진 등 로봇/스파이더에 의한 방문은 로봇/스파이더 방문으로 별도 구별하여 처리하는 것으로 한다.


방문자 구분의 기술적 방법

방문자수의 측정을 위해 '방문자'를 어떻게 정의하느냐에 따라 측정값은 달라질 수 있다.
현재 주로 사용되고 있는 방문자 정의를 위한 방문자 구별기준은 다음과 같다.

  • 방문한 클라이언트의 IP를 이용하여 방문자를 구별하는 경우
    • 방문자 개인PC(또는 핸드폰등 인터넷에 접근가능한 다양한 장치)에게 할당받은 IP주소를 이용하는 경우이다.
    • 하나의 PC에서 여러종류의 클라이언트(예: 웹브라우저)를 이용하더라도 하나의 방문자로 구분된다. 즉, 일반적으로 PC단위로 방문자를 구분한다. (개인PC가 여럿의 IP를 할당받는 경우 제외)
    • 개인 PC의 IP가 변경될 경우 다른 방문자로 구분된다. (예: 하루에 노트북 컴퓨터를 직장과 가정에서 사용할 경우. 일순수 방문자가 둘로 나뉘어진다.)
    • 인터넷공유, NAT와 같이 하나의 공인IP를 공유하여 사설IP의 PC가 웹사이트에 접근할 경우 올바른 방문자의 구분이 어렵다.
    • 초기 웹서버 로그파일을 이용한 웹분석에서 주로 사용되던 방법이다.
    • 현재에도 다양한 방문자 구별을 위한 기술적 요소의 사용이 불가능할 때 IP를 이용하여 구분하기도 한다.
  • 방문한 클라이언트의 쿠키값을 이용하여 방문자를 구별하는 경우
    • 클라이언트의 쿠키값을 이용하므로, 일반적으로 검색엔진 로봇/스파이더등은 배제된다.
    • 하나의 PC에서 2개의 다른 클라이언트(또는 쿠키영역이 다른 프로세스로 동일한 클라이언트)를 사용할 경우 2개의 방문자로 구분된다.
    • 쿠키를 사용자가 삭제하는 경우 새로운 방문자로 구분된다.
  • IP 및 쿠키를 동시에 이용하여 방문자를 구별하는 경우
    • 쿠키값 이용의 장점과 IP이용의 장점을 동시에 이용한다.
    • 특히 쿠키를 지원하지 않는 클라이언트와 쿠키를 지원하는 클라이언트들의 방문이 혼재하는 경우 주로 사용된다.
방문자의 하위 속성

방문자를 하나의 사람으로 가정하고 분석할 때, 각 방문자는 다양한 하위속성을 갖는다.
가장 큰 특성은, 인구통계학적 특성으로서 성별, 연령, 거주지역 등이며 인터넷 사용환경인 웹브라우저의 종류, 모니터해상도, OS종류등도 하나의 특성이 될 수 있다.
실제 웹분석의 리포트 구현에 있어서는 방문자의 하위 속성에 의해 세분화된 측정지표 값을 통해 이루어지게 된다.
사실 웹분석에 있어서 '방문자'는 익명의 방문자이므로 위와 같은 인구통계학적 특성을 세밀히 수집하는 것은 불가능하며, 이후 설명할 UUID 부분에서 주로 이용하게 될것이다.


2002-2008 © Nativic & BizSpring, Inc.

Posted by nativic