Ë
    (<çi©  ã                   ó<  — U d Z ddlZddlZddlZddlZddlmZmZmZm	Z	m
Z
 	 ddlmZ ddlmZmZ ddlmZ  ej(                  e«      Z edd	¬
«      ZddddœddddœddddœddddœddddœddddœddddœddddœgZe	eeef      ed<    G d„ de«      Z G d„ de«      Zdedeedf   fd „Zej=                  d!«      deeef   fd"„«       Zej=                  d#«      deeef   fd$„«       Z ejC                  d%«      d&edefd'„«       Z"y# e$ rZ ed«      e‚dZ[ww xY w)(uo  OpenAI í˜¸í™˜ API ì„œë²„ â€” FastAPI ê¸°ë°˜.

ì—”ë“œí¬ì¸íŠ¸:
  POST /v1/chat/completions  â€” OpenAI Chat Completions í˜•ì‹
  GET  /v1/models            â€” ì‚¬ìš© ê°€ëŠ¥ ëª¨ë¸ ëª©ë¡
  GET  /health               â€” ì„œë²„ ìƒíƒœ

ì‹¤í–‰:
  uvicorn services.openai_compat_server:app --port 8080

ì˜ì¡´ì„±: fastapi, uvicorn, pydantic (ë¯¸ì„¤ì¹˜ ì‹œ ImportError)
é    N)ÚAnyÚAsyncGeneratorÚDictÚListÚOptional)ÚFastAPI)ÚJSONResponseÚStreamingResponse)Ú	BaseModelub   fastapi, pydanticì´ í•„ìš”í•©ë‹ˆë‹¤. pip install fastapi uvicorn pydantic ìœ¼ë¡œ ì„¤ì¹˜í•˜ì„¸ìš”.zOpenAI Compatible APIz1.0.0)ÚtitleÚversionzgpt-4oÚmodelÚopenai)ÚidÚobjectÚowned_byzgpt-4o-minizclaude-sonnet-4-6Ú	anthropiczclaude-opus-4-6zclaude-haiku-4-5zgemini-2.5-proÚgooglezgemini-2.5-flashzdeepseek-chatÚdeepseekÚ_SUPPORTED_MODELSc                   ón   — e Zd ZU eed<   eeeef      ed<   dZe	e
   ed<   dZe	e   ed<   dZe	e   ed<   y)ÚChatCompletionRequestr   ÚmessagesNÚtemperatureÚ
max_tokensFÚstream)Ú__name__Ú
__module__Ú__qualname__ÚstrÚ__annotations__r   r   r   r   r   Úfloatr   Úintr   Úbool© ó    úN/home/jay/workspace/.worktrees/task-2057-dev2/services/openai_compat_server.pyr   r   2   sD   … ØƒJØ4˜˜S˜‘>Ñ"Ó"Ø#'€K˜%‘Ó'Ø $€J˜‘Ó$Ø"€FˆHT‰NÔ"r&   r   c                   ón   — e Zd ZU eed<   eed<   eed<   eed<   eeeef      ed<   dZ	e
eeef      ed<   y)ÚChatCompletionResponser   r   Úcreatedr   ÚchoicesNÚusage)r   r   r   r    r!   r#   r   r   r   r,   r   r%   r&   r'   r)   r)   :   s@   … ØƒGØƒKØƒLØƒJØ$s˜Cx‘.Ñ!Ó!Ø&*€Eˆ8D˜˜c˜‘NÑ#Ô*r&   r)   ÚreqÚreturnc           	     óx  K  — dt        j                  «       j                  dd › }t        t	        j                  «       «      }dD ]8  }|d|| j
                  dd|dœdd	œgd
œ}dt        j                  |«      › d­–— Œ: |d|| j
                  di dd	œgd
œ}dt        j                  |«      › d­–— d­–— y­w)up   Server-Sent Events í˜•ì‹ ì²­í¬ ìŠ¤íŠ¸ë¦¬ë°.
    TODO: stub â€” ì‹¤ì œ LLM ìŠ¤íŠ¸ë¦¬ë° í˜¸ì¶œë¡œ êµì²´.
    ú	chatcmpl-Né   )ÚThisz isz az stubz	 responseú.zchat.completion.chunkr   Ú	assistant©ÚroleÚcontent)ÚindexÚdeltaÚfinish_reason)r   r   r*   r   r+   zdata: z

Ústopzdata: [DONE]

)ÚuuidÚuuid4Úhexr#   Útimer   ÚjsonÚdumps)r-   Úridr*   ÚtokenÚchunkÚfinals         r'   Ú_stream_responserF   H   sÕ   è ø€ ð ”d—j‘j“l×&Ñ& s¨Ð+Ð,Ð
-€CÜ”$—)‘)“+Ó€GàAò /ˆàÐ!8ÀWØ—Y‘YØ"#°{ÈuÑ.UØ*.ñ0ð 1ñ
ˆð ”t—z‘z %Ó(Ð)¨Ð.Ô.ð/ð Ð4ÀØ—‘Ø¨"¸vÑFÐGñ€Eð
 ”4—:‘:˜eÓ$Ð% TÐ
*Ó*Ø
Ôùs   ‚B8B:z/healthc               ƒ   ó   K  — ddiS ­w)u   ì„œë²„ ìƒíƒœ í™•ì¸.ÚstatusÚokr%   r%   r&   r'   ÚhealthrJ   e   s   è ø€ ð dÐÐùs   ‚z
/v1/modelsc               ƒ   ó   K  — dt         dœS ­w)u6   ì‚¬ìš© ê°€ëŠ¥í•œ ëª¨ë¸ ëª©ë¡ ë°˜í™˜ (OpenAI í˜•ì‹).Úlist)r   Údata)r   r%   r&   r'   Úlist_modelsrN   k   s   è ø€ ð Ô&7Ñ8Ð8ùs   ‚
z/v1/chat/completionsÚrequestc              ƒ   óR  K  — | j                   rt        t        | «      ddddœ¬«      S t        dt	        j
                  «       j                  dd › d	t        t        j                  «       «      | j                  d
dddœddœgd
d
d
dœ¬«      }t        |j                  «       ¬«      S ­w)uØ   OpenAI Chat Completions í˜¸í™˜ ì—”ë“œí¬ì¸íŠ¸.

    stream=True  â†’ SSE(Server-Sent Events) ìŠ¤íŠ¸ë¦¬ë° ì‘ë‹µ
    stream=False â†’ ë‹¨ì¼ JSON ì‘ë‹µ (ê¸°ë³¸)

    TODO: stub â€” ì‹¤ì œ LLM í˜¸ì¶œë¡œ êµì²´.
    ztext/event-streamzno-cacheÚno)zCache-ControlzX-Accel-Buffering)Ú
media_typeÚheadersr0   Nr1   zchat.completionr   r4   z8This is a stub response. TODO: connect real LLM backend.r5   r;   )r8   Úmessager:   )Úprompt_tokensÚcompletion_tokensÚtotal_tokens)r   r   r*   r   r+   r,   )r7   )r   r
   rF   r)   r<   r=   r>   r#   r?   r   r	   Ú
model_dump)rO   Úresps     r'   Úchat_completionsrZ   q   s®   è ø€ ð ‡~‚~Ü Ü˜WÓ%Ø*Ø&0ÀtÑLô
ð 	
ô "Ø”t—z‘z“|×'Ñ'¨¨Ð,Ð-Ð.Ø Ü”D—I‘I“KÓ Øm‰màà#ØUñð $ñ
ð ð !"¸È1ÑMô€Dô  §¡Ó 1Ô2Ð2ùs   ‚B%B')#Ú__doc__r@   Úloggingr?   r<   Útypingr   r   r   r   r   Úfastapir   Úfastapi.responsesr	   r
   Úpydanticr   ÚImportErrorÚ_errÚ	getLoggerr   ÚloggerÚappr   r    r!   r   r)   rF   ÚgetrJ   rN   ÚpostrZ   r%   r&   r'   ú<module>rh      s   ðòó Û Û Û ß <Õ <ðÝßAÝ"ð 
ˆ×	Ñ	˜8Ó	$€ÙÐ+°WÔ=€ð ¨'¸xÑHØ¨'¸xÑHØ¨'¸{ÑKØ¨'¸{ÑKØ¨'¸{ÑKØ¨'¸xÑHØ¨'¸xÑHØ¨'¸zÑJð	+Ð 4˜˜S #˜X™Ñ'ó 	ô"#˜Iô #ô+˜Yô +ðÐ 5ð ¸.ÈÈdÈÑ:Só ð: ‡ˆÓðd˜3 ˜8‘nò ó ðð
 ‡ˆÓð9˜4  S ™>ò 9ó ð9ð
 ‡Ð
 Ó!ð3Ð$9ð 3¸cò 3ó "ñ3øðu ò Ù
ð	Góð ðûðús   £D ÄDÄ	DÄD