Ë
    ªgù
  ã                   óz   — d dl Z d dlZd dlZd dlZd dlmZ  e j                  e«      Zd„ Z	d„ Z
d„ Z G d„ d«      Zy)é    N)ÚConv1Dc                 ó<  — | j                   j                  \  }}t        j                  j	                  ||«      }| j                   j
                  j                  j                  «       |j                   _        | j                  j
                  |j                  _        |S )N)	ÚweightÚshapeÚtorchÚnnÚLinearÚdataÚTÚ
contiguousÚbias)ÚmoduleÚin_sizeÚout_sizeÚlinears       ú]/var/www/openai/venv/lib/python3.12/site-packages/onnxruntime/transformers/quantize_helper.pyÚ_conv1d_to_linearr      sj   € ØŸ™×+Ñ+Ñ€GˆXÜX‰X_‰_˜W hÓ/€FØŸ™×+Ñ+×-Ñ-×8Ñ8Ó:€F‡MMÔØ—{‘{×'Ñ'€F‡KKÔØ€Mó    c                 óì   — t         j                  d«       t        | j                  «      D ]G  }| j                  |   }t	        |t
        «      rt        |«      }|| j                  |<   Œ=t        |«       ŒI y)zsin-place
    This is for Dynamic Quantization, as Conv1D is not recognized by PyTorch, convert it to nn.Linear
    zreplace Conv1D with LinearN)ÚloggerÚdebugÚlistÚ_modulesÚ
isinstancer   r   Úconv1d_to_linear)ÚmodelÚnamer   r   s       r   r   r      s\   € ô ‡LLÐ-Ô.ÜU—^‘^Ö$ˆØ—‘ Ñ%ˆÜfœfÔ%Ü& vÓ.ˆFØ#)ˆEN‰N˜4Ò ä˜VÕ$ñ %r   c                 ó¼   — t        j                  | j                  «       d«       t        j                  j                  d«      dz  }t        j                  d«       |S )Nztemp.pé   )r   ÚsaveÚ
state_dictÚosÚpathÚgetsizeÚremove)r   Úsizes     r   Ú_get_size_of_pytorch_modelr'   '   sA   € Ü	‡JJˆu×ÑÓ! 8Ô,Ü7‰7?‰?˜8Ó$¨Ñ4€DÜ‡IIˆhÔØ€Kr   c                   óF   — e Zd Zeej
                  fd„«       Zedd„«       Zy)ÚQuantizeHelperc                 ó  — t        | «       t        j                  j                  | t        j                  j
                  h|¬«      }t        j                  dt        | «      › «       t        j                  dt        |«      › «       |S )z{
        Usage: model = quantize_model(model)

        TODO: mix of in-place and return, but results are different
        )Údtypez'Size of full precision Torch model(MB):z"Size of quantized Torch model(MB):)	r   r   ÚquantizationÚquantize_dynamicr   r	   r   Úinfor'   )r   r+   Úquantized_models      r   Úquantize_torch_modelz#QuantizeHelper.quantize_torch_model/   ss   € ô 	˜ÔÜ×,Ñ,×=Ñ=¸eÄeÇhÁhÇoÁoÐEVÐ^cÐ=ÓdˆÜ‰Ð=Ô>XÐY^Ó>_Ð=`ÐaÔbÜ‰Ð8Ô9SÐTcÓ9dÐ8eÐfÔgØÐr   c                 ó¾  — ddl m} ddlm}  ||«      j                  j                  dd¬«       t        j                  dt        j                  j                  | «      dz  › «        || ||dt        j                  j                  i¬	«       t        j                  d
|› «       t        j                  dt        j                  j                  |«      dz  › «       y )Nr   )ÚPath)r-   T)ÚparentsÚexist_okz&Size of full precision ONNX model(MB):r   ÚDefaultTensorType)Úuse_external_data_formatÚextra_optionszquantized model saved to:z!Size of quantized ONNX model(MB):)Úpathlibr2   Úonnxruntime.quantizationr-   ÚparentÚmkdirr   r.   r"   r#   r$   ÚonnxÚTensorProtoÚFLOAT)Úonnx_model_pathÚquantized_model_pathr6   r2   r-   s        r   Úquantize_onnx_modelz"QuantizeHelper.quantize_onnx_model<   sµ   € å å=áÐ!Ó"×)Ñ)×/Ñ/¸ÀtÐ/ÔLÜ‰Ð<¼R¿W¹W¿_¹_È_Ó=]Ð_hÑ=iÐ<jÐkÔlÙØØ Ø%=Ø.´×0@Ñ0@×0FÑ0FÐGõ		
ô 	‰Ð/Ð0DÐ/EÐFÔGä‰Ð7¼¿¹¿¹ÐH\Ó8]Ð_hÑ8iÐ7jÐkÕlr   N)F)Ú__name__Ú
__module__Ú__qualname__Ústaticmethodr   Úqint8r0   rA   © r   r   r)   r)   .   s1   „ ØØ*/¯+©+ò 
ó ð
ð òmó ñmr   r)   )Úloggingr"   r<   r   Útransformers.modeling_utilsr   Ú	getLoggerrB   r   r   r   r'   r)   rG   r   r   Ú<module>rK      sC   ðó Û 	ã Û Ý .à	ˆ×	Ñ	˜8Ó	$€òò%ò÷mò mr   