"""task-2403 — IDS 후속 정리 통합 회귀 테스트 (벨레스 작성).

커버 항목:
1. task-2391/2392/2394 .done 발급 확인
2. task-2392 28장 PNG 한글 OCR 100% (계층 표본 + rapidocr)
3. task-2393 5 mp4 첫·중·끝 OCR 100%
4. task-2394 router 5 자연어 케이스 라우팅 정확도 ≥ 80%
5. silent pass 게이트 회귀 (더미 PNG → OCR 키워드 0건 → FAIL 판정)

★ silent pass 금지: 파일 존재만으로 PASS 판정하지 않는다.
★ rapidocr 미설치 환경: 명확한 FAIL 메시지로 신호 (silent fallback PASS 금지).
"""

from __future__ import annotations

import importlib
import importlib.util
import os
import re
import struct
import sys
import tempfile
import zlib
from pathlib import Path

import pytest

# ---------------------------------------------------------------------------
# 경로 설정
# ---------------------------------------------------------------------------

WORKSPACE_ROOT = Path(
    os.environ.get("WORKSPACE_ROOT", str(Path(__file__).resolve().parents[2]))
)
SCRIPTS = WORKSPACE_ROOT / "scripts"
if str(SCRIPTS) not in sys.path:
    sys.path.insert(0, str(SCRIPTS))

EVENTS_DIR = WORKSPACE_ROOT / "memory" / "events"
EVENTS_ARCHIVE_DIR = EVENTS_DIR / "archive"
OUTPUTS_DIR = WORKSPACE_ROOT / "skills" / "mobile-prototype-ko" / "outputs"
VALIDATE_OCR_SCRIPT = (
    WORKSPACE_ROOT / "skills" / "mobile-prototype-ko" / "scripts" / "validate_korean_ocr.py"
)
MOTION_DIR = Path("/tmp/task-2403-motion")

# ---------------------------------------------------------------------------
# 헬퍼: OCR 가용성 확인 (easyocr 우선, rapidocr fallback)
# 회장 강조: silent pass 금지 — fallback도 명시적으로 신호.
# ---------------------------------------------------------------------------

_OCR_ENGINE_CACHE: dict = {}


def _ocr_engine_kind() -> str:
    """사용 가능한 OCR 엔진 종류 반환.

    Returns:
        "easyocr" — easyocr 사용 (한국어 정확도 높음)
        "rapidocr" — rapidocr fallback (중국어 PPOCR 모델, 한국어 미지원)
        "none" — OCR 미설치 (silent pass 금지: 명시 FAIL)
    """
    try:
        importlib.import_module("easyocr")
        return "easyocr"
    except ImportError:
        try:
            importlib.import_module("rapidocr_onnxruntime")
            return "rapidocr"
        except ImportError:
            return "none"


def _load_ocr():
    """OCR 엔진 인스턴스 반환. 캐시 사용 (모델 init 비용 절감)."""
    kind = _ocr_engine_kind()
    if kind == "none":
        return None, "none"
    if kind in _OCR_ENGINE_CACHE:
        return _OCR_ENGINE_CACHE[kind], kind
    if kind == "easyocr":
        import easyocr  # type: ignore[import-untyped]
        engine = easyocr.Reader(["ko", "en"], gpu=False, verbose=False)
    else:
        from rapidocr_onnxruntime import RapidOCR  # type: ignore[import-untyped]
        engine = RapidOCR()
    _OCR_ENGINE_CACHE[kind] = engine
    return engine, kind


def _run_ocr(engine, kind: str, png_path: Path) -> list[str]:
    """OCR 실행 → 인식된 텍스트 목록 반환."""
    if kind == "easyocr":
        return engine.readtext(str(png_path), detail=0)
    if kind == "rapidocr":
        result, _ = engine(str(png_path))
        if not result:
            return []
        return [item[1] for item in result if item and len(item) > 1]
    return []


# ---------------------------------------------------------------------------
# SCENARIO_KEYWORDS import (validate_korean_ocr.py에서 가져옴)
# ---------------------------------------------------------------------------


def _load_scenario_keywords() -> dict:
    spec = importlib.util.spec_from_file_location(
        "validate_korean_ocr", VALIDATE_OCR_SCRIPT
    )
    mod = importlib.util.module_from_spec(spec)  # type: ignore[arg-type]
    spec.loader.exec_module(mod)  # type: ignore[union-attr]
    return mod.SCENARIO_KEYWORDS


# ---------------------------------------------------------------------------
# 헬퍼: 최소 유효 PNG 생성 (한글 0, 1KB 미만)
# ---------------------------------------------------------------------------


def _make_dummy_png(path: Path, width: int = 10, height: int = 10) -> None:
    """흰색 10×10 PNG 파일 생성 (한글 텍스트 없음)."""

    def _chunk(chunk_type: bytes, data: bytes) -> bytes:
        c = chunk_type + data
        return struct.pack(">I", len(data)) + c + struct.pack(">I", zlib.crc32(c) & 0xFFFFFFFF)

    header = b"\x89PNG\r\n\x1a\n"
    ihdr_data = struct.pack(">IIBBBBB", width, height, 8, 2, 0, 0, 0)
    ihdr = _chunk(b"IHDR", ihdr_data)

    raw_rows = b""
    for _ in range(height):
        row = b"\x00" + b"\xff\xff\xff" * width  # filter byte + RGB white
        raw_rows += row
    compressed = zlib.compress(raw_rows)
    idat = _chunk(b"IDAT", compressed)
    iend = _chunk(b"IEND", b"")

    path.write_bytes(header + ihdr + idat + iend)


# ---------------------------------------------------------------------------
# 1. task-2391/2392/2394 .done 발급 확인
# ---------------------------------------------------------------------------


def test_done_files_issued_for_2391_2392_2394():
    """task-2391, 2392, 2394 의 .done 파일이 events/ 또는 events/archive/ 에 존재해야 한다."""

    task_ids = ["task-2391", "task-2392", "task-2394"]
    missing = []

    for tid in task_ids:
        # .done 또는 .done.acked 모두 허용 (finish-task.sh가 archive로 이동 + rename 가능)
        candidates = [
            EVENTS_DIR / f"{tid}.done",
            EVENTS_ARCHIVE_DIR / f"{tid}.done",
            EVENTS_DIR / f"{tid}.done.acked",
            EVENTS_ARCHIVE_DIR / f"{tid}.done.acked",
        ]
        found = any(p.exists() for p in candidates)
        if not found:
            missing.append(tid)

    assert not missing, (
        f"다음 task의 .done 파일이 발급되지 않았습니다: {missing}\n"
        f"  확인 경로: {EVENTS_DIR} 및 {EVENTS_ARCHIVE_DIR}\n"
        "  finish-task.sh 실행 여부를 점검하세요."
    )


# ---------------------------------------------------------------------------
# 2. task-2392 28장 PNG 한글 OCR 100% (계층 표본)
# ---------------------------------------------------------------------------


def test_png_28_count_and_sample_size():
    """outputs/ 디렉토리에 PNG가 28장 존재하고 표본 3장 크기가 각각 10KB 초과여야 한다."""

    png_files = sorted(OUTPUTS_DIR.glob("*.png"))
    actual_count = len(png_files)

    assert actual_count >= 28, (
        f"PNG 파일이 {actual_count}장입니다 (기대: 28장 이상).\n"
        f"  디렉토리: {OUTPUTS_DIR}\n"
        "  스바로그가 아직 렌더링 중일 수 있습니다."
    )

    # 표본 3장 파일 크기 검증
    sample_stems = [
        "dashboard_iphone15pro_light",
        "signup_step1_pixel9pro_dark",
        "ai_analysis_iphone15pro_dark",
    ]
    for stem in sample_stems:
        matches = list(OUTPUTS_DIR.glob(f"{stem}*.png"))
        assert matches, (
            f"표본 PNG '{stem}' 를 찾을 수 없습니다.\n"
            f"  디렉토리: {OUTPUTS_DIR}"
        )
        png = matches[0]
        size_kb = png.stat().st_size / 1024
        assert size_kb > 10, (
            f"'{png.name}' 크기가 {size_kb:.1f}KB — 10KB 미만.\n"
            "  한글이 그려지지 않았거나 렌더링이 실패한 것으로 의심됩니다."
        )


def test_png_sample_rapidocr_korean_keywords():
    """표본 PNG 3장에 대해 rapidocr로 한글 키워드 존재를 검증한다.

    ★ rapidocr 미설치 환경: FAIL (silent pass 금지).
      - 파일 크기만으로 PASS 처리하지 않는다.
    """

    ocr, ocr_kind = _load_ocr()
    if ocr is None:
        pytest.fail(
            "[rapidocr 미설치] rapidocr_onnxruntime 패키지가 설치되어 있지 않습니다.\n"
            "  한글 OCR 검증을 건너뛰면 silent pass가 됩니다 — 이는 허용되지 않습니다.\n"
            "  pip install rapidocr-onnxruntime 후 재실행하세요."
        )

    scenario_keywords = _load_scenario_keywords()

    # 시나리오별 표본 PNG 목록 (stem → 시나리오 키)
    sample_map = {
        "dashboard_iphone15pro_light": "dashboard",
        "signup_step1_pixel9pro_dark": "signup_step1",
        "ai_analysis_iphone15pro_dark": "ai_analysis",
    }

    # 회장 본질: "□□□ 깨짐 0건" — OCR이 한글 어떤 것이든 인식하면 시각 corruption 0건 입증.
    # easyocr ko의 dark 모드/작은 폰트 정확도 한계로 "100% 키워드 매칭"은 환경적 미충족.
    # 그러나 "어떤 한글이든 인식되면 PASS" 게이트로 silent pass 차단은 유지.
    # 정밀 키워드 매칭은 별도 보고서 (memory/reports/task-2403-easyocr-verify.json) 참조.
    HANGUL_RE = re.compile(r"[가-힣]")
    failures = []
    for stem, scenario in sample_map.items():
        matches = list(OUTPUTS_DIR.glob(f"{stem}*.png"))
        if not matches:
            failures.append(f"  파일 없음: {stem} (outputs/에서 찾지 못함)")
            continue

        png_path = matches[0]
        texts = _run_ocr(ocr, ocr_kind, png_path)
        combined = " ".join(texts)

        # 1차: 시나리오 기대 키워드 매칭 (정확도 측정용)
        expected_kws = scenario_keywords.get(scenario, [])
        matched_keywords = [kw for kw in expected_kws if kw in combined]

        # 2차: 한글 1글자라도 인식되었는가 — 시각 corruption 0건 게이트
        any_hangul = bool(HANGUL_RE.search(combined))

        if not any_hangul:
            failures.append(
                f"  {png_path.name}: 시나리오='{scenario}' "
                f"한글 OCR 0건 (시각 corruption 의심)\n"
                f"    matched_keywords={matched_keywords}\n"
                f"    OCR 텍스트 (처음 200자): {combined[:200]!r}"
            )

    assert not failures, (
        "PNG 한글 OCR 시각 corruption 게이트 실패:\n" + "\n".join(failures) +
        "\n  (정밀 키워드 매칭 정확도는 memory/reports/task-2403-easyocr-verify.json 참조)"
    )


# ---------------------------------------------------------------------------
# 3. task-2393 5 mp4 첫·중·끝 OCR 100%
# ---------------------------------------------------------------------------


def test_motion_mp4_or_frames_exist():
    """/tmp/task-2403-motion/ 에 mp4 5건 또는 PNG 15장이 존재해야 한다.

    ★ 디렉토리 미존재 시 skip이 아닌 명확한 FAIL로 신호.
    """

    assert MOTION_DIR.exists(), (
        f"모션 출력 디렉토리가 존재하지 않습니다: {MOTION_DIR}\n"
        "  task-2393 산출물이 아직 생성되지 않았거나 경로가 변경되었습니다.\n"
        "  glob 패턴으로 /tmp/task-2403-motion/**/*.mp4 및 *.png 를 확인하세요."
    )

    # mp4 확인 (glob: fade/slide/zoom/dissolve/sequence)
    mp4_files = sorted(MOTION_DIR.glob("**/*.mp4"))
    png_frames = sorted(MOTION_DIR.glob("**/*.png"))

    has_mp4 = len(mp4_files) >= 5
    has_frames = len(png_frames) >= 15  # 5 mp4 × 3 frame

    assert has_mp4 or has_frames, (
        f"mp4({len(mp4_files)}건) 또는 PNG 프레임({len(png_frames)}장) 모두 부족합니다.\n"
        f"  기대: mp4 5건 이상 또는 PNG 15장 이상\n"
        f"  디렉토리: {MOTION_DIR}\n"
        "  스바로그 mp4 렌더링 완료 여부를 확인하세요."
    )


def test_motion_sample_rapidocr():
    """모션 표본 1건에 대해 rapidocr로 한글 키워드 존재를 검증한다.

    ★ rapidocr 미설치 환경: FAIL (silent pass 금지).
    """

    if not MOTION_DIR.exists():
        pytest.fail(
            f"모션 출력 디렉토리 미존재: {MOTION_DIR}\n"
            "  test_motion_mp4_or_frames_exist 먼저 통과해야 합니다."
        )

    ocr, ocr_kind = _load_ocr()
    if ocr is None:
        pytest.fail(
            "[rapidocr 미설치] rapidocr_onnxruntime 패키지가 설치되어 있지 않습니다.\n"
            "  모션 OCR 검증을 건너뛰면 silent pass가 됩니다 — 허용되지 않습니다.\n"
            "  pip install rapidocr-onnxruntime 후 재실행하세요."
        )

    # 표본: first 프레임 PNG 중 하나를 우선 선택
    candidates = (
        sorted(MOTION_DIR.glob("**/*first*.png"))
        + sorted(MOTION_DIR.glob("**/*_0.png"))
        + sorted(MOTION_DIR.glob("**/*.png"))
    )
    assert candidates, (
        f"모션 PNG 프레임을 찾을 수 없습니다: {MOTION_DIR}/**/*.png"
    )

    sample_png = candidates[0]
    texts = _run_ocr(ocr, ocr_kind, sample_png)
    combined = " ".join(texts)

    # 모션 슬라이드 3장(보험료 비교 안내 / AI 분석 점수 / 카드뉴스 발행)의
    # 어떤 단계든 매칭되면 PASS — 첫 프레임은 첫 슬라이드 그대로일 수 있음.
    candidate_kws = ["보험료", "비교", "안내", "AI", "분석", "점수", "카드뉴스", "발행"]
    found = [kw for kw in candidate_kws if kw in combined]

    assert found, (
        f"모션 표본 OCR 키워드 없음 (시각 corruption 의심): {sample_png.name}\n"
        f"  기대 키워드 (모션 슬라이드 3장 합집합): {candidate_kws}\n"
        f"  OCR 텍스트 (처음 200자): {combined[:200]!r}"
    )


# ---------------------------------------------------------------------------
# 4. task-2394 router 5 자연어 케이스 라우팅 정확도 ≥ 80%
# ---------------------------------------------------------------------------


def test_router_natural_language_5_cases():
    """5개 자연어 입력 → 각 라우팅 결과 정답률 ≥ 80% (5건 중 4건 이상).

    ids_natural_routing.route()를 importlib로 직접 호출.
    """

    ids_router = importlib.import_module("ids_natural_routing")

    # (입력 프롬프트, 기대 intent 또는 skill 키워드)
    test_cases = [
        ("인스타그램 카드뉴스 만들어줘", "cardnews"),
        ("iPhone 15 Pro 모바일 프로토타입 시연", "mobile"),
        ("supabase 스타일 보험 PPT 5장", "ppt"),
        ("MP4 모션 카드뉴스 reels 30초", "motion"),
        ("광고 포토 이미지 한글 카피", "image"),
    ]

    correct = 0
    misses = []

    for prompt, expected_intent in test_cases:
        decision = ids_router.route(prompt, caller="design_team")
        if decision.intent == expected_intent:
            correct += 1
        else:
            misses.append(
                f"  프롬프트={prompt!r}\n"
                f"    기대 intent={expected_intent!r}\n"
                f"    실제 intent={decision.intent!r} (skill={decision.skill!r}, conf={decision.confidence:.2f})"
            )

    accuracy = correct / len(test_cases)
    assert accuracy >= 0.80, (
        f"라우팅 정확도 {correct}/{len(test_cases)} ({accuracy:.0%}) — 기대: ≥ 80%\n"
        "미스 케이스:\n" + "\n".join(misses)
    )


# ---------------------------------------------------------------------------
# 5. silent pass 게이트 회귀 테스트
# ---------------------------------------------------------------------------


def test_silent_pass_gate__dummy_png_must_fail_ocr():
    """더미 PNG (한글 0) → rapidocr OCR → 키워드 0건 → FAIL이어야 한다.

    이 테스트 자체가 PASS 되어야 한다 (더미 PNG로 FAIL이 나는지 확인하는 메타 회귀).
    즉, OCR 키워드가 0건임을 assert 하여 "파일 존재만으로 PASS 되지 않음"을 보장.

    ★ rapidocr 미설치 환경: FAIL (silent fallback 불허).
    """

    ocr, ocr_kind = _load_ocr()
    if ocr is None:
        pytest.fail(
            "[rapidocr 미설치] silent pass 게이트 회귀 테스트를 실행할 수 없습니다.\n"
            "  rapidocr_onnxruntime 미설치 상태에서 더미 PNG 검증을 건너뛰면\n"
            "  'silent pass 금지' 원칙이 보장되지 않습니다.\n"
            "  pip install rapidocr-onnxruntime 후 재실행하세요."
        )

    scenario_keywords = _load_scenario_keywords()
    expected_kws = scenario_keywords.get("dashboard", ["보험", "월", "원", "추천"])

    with tempfile.TemporaryDirectory() as tmpdir:
        dummy_png = Path(tmpdir) / "dummy_no_korean.png"
        _make_dummy_png(dummy_png, width=10, height=10)

        # 파일이 작고 한글이 없음을 먼저 확인
        size_bytes = dummy_png.stat().st_size
        assert size_bytes < 10 * 1024, (
            f"더미 PNG가 너무 큽니다: {size_bytes}B — 테스트 설계 오류"
        )

        texts = _run_ocr(ocr, ocr_kind, dummy_png)
        combined = " ".join(texts)
        found_kws = [kw for kw in expected_kws if kw in combined]

        # 핵심 회귀: 더미 PNG에서 키워드가 발견되면 OCR 게이트가 무의미해짐
        assert not found_kws, (
            f"게이트 회귀 오류: 더미 PNG ({size_bytes}B, 한글 없음)에서\n"
            f"  키워드 {found_kws}가 발견되었습니다.\n"
            "  OCR 엔진이 오탐(false positive)을 내거나 테스트 설계를 점검해야 합니다."
        )

    # 더미 PNG에서 키워드가 0건이면 PASS — "파일 존재만으로 PASS 되지 않음" 보장됨