
    i=                    J    d Z ddlmZ ddlZddlmZ ddZedk(  r e        yy)uD   정제된 배치 결과를 하나의 wiki_entries.json으로 통합.    )annotationsN)Pathc            	        t        d      } g }t        | j                  d            D ]  }	 t        j                  |j                  d            }t        |t              r7|j                  |       t        d|j                   dt        |       d       nt        d|j                   d        t        |d
      D ]  \  }}d|d|d<    g }|D ]  }|j                  dd      }t        |      dk  r|j                  d|d    d| d       |j!                  d      r|j                  d|d    d| d       |j                  d      |j                  d      k(  r|j                  d|d    d       |j                  dg       }	t        |	      dk  s|j                  d|d    d|	         i }
|D ],  }|j                  dd      }|
j                  |d      d
z   |
|<   . i }|D ],  }|j                  d d!      }|j                  |d      d
z   ||<   . t        d"      }|j#                  t        j$                  |d#d$%      d       t        d&       t        d't        |       d(       t        d)       t        |
j'                         d* +      D ]  \  }}t        d| d| d(        t        d,       t        |j'                         d- +      D ]  \  }}t        d| d| d(        |rWt        d.t        |       d/       |d d0 D ]  }t        |        t        |      d0kD  r't        d1t        |      d0z
   d(       nt        d2       t        d3|        t        d4|j)                         j*                  d5z  d6d7       y # t        $ r&}t        d|j                   d	|        Y d }~d }~ww xY w)8Nz/tmp/refinedzbatch_*.jsonzutf-8)encodingz  z: u
   건 로드u   : 배열이 아님 — 스킵u   : 로드 실패 —    )startzkakao-03didtitle 
   z  [u   ] 제목 너무 짧음: ''u
   #궁금증u   ] 제목이 원본 그대로: 'answerquestionu   ] 답변 = 질문 동일keywords   u   ] 키워드 부족: categoryu   기타r   
confidencemediumzE/home/jay/projects/insuwiki/scripts/kakao_knowledge/wiki_entries.jsonF   )ensure_asciiindentu   
=== 통합 결과 ===u   총 항목 수: u   건u   
카테고리 분포:c                    | d    S Nr    xs    F/home/jay/workspace/.worktrees/task-2116-dev1/scripts/merge_refined.py<lambda>zmain.<locals>.<lambda>>   s    AaD5     )keyu   
신뢰도 분포:c                    | d    S r   r   r   s    r   r   zmain.<locals>.<lambda>A   s    adU r    u   
품질 이슈 (u   건):   u
     ... 외 u   
품질 이슈 없음u   
저장 완료: u   파일 크기: i   z.1fKB)r   sortedglobjsonloads	read_text
isinstancelistextendprintnamelen	Exception	enumerategetappend
startswith
write_textdumpsitemsstatst_size)refined_dirall_entries
batch_filedataexcientryissuesr   kwcat_distcat	conf_distconfoutput_pathcntissues                    r   mainrJ      s   ~&K K[--n=> 	C
	C::j22G2DED$%""4(:??+2c$i[
CD:??++HIJ	C k3 '5qg&d' F 
G		'2&u:?MMCd},EeWANOL)MMCd},KE7RSTU99X%))J"77MMCd},DEFYYz2&r7Q;MMCd},@EF
G  "H 1ii
H- S!,q01
 !#I 5yyx0#--a014	$5 ^_K

;U1=  
 
#%	S-.c
23	"$8>>+A $S3%r#c"#$	!IOO-?C %	c4&3%s#$% !#f+e45CR[ 	E%L	v;Js6{2~.c23&'	k]
+,	OK,,.66=cB"
EFu  	CBz'';C5ABB	Cs   BN	ON>>O__main__)returnNone)__doc__
__future__r   r'   pathlibr   rJ   __name__r   r    r   <module>rR      s-    J "  FGR zF r    