Ë
    ªg*  ã                   óø   — d dl Z d dlZd dlmZ d dlmZmZmZ d dlZd dl	m
Z
 d dlmZ d dlmZ d dlmZmZmZ d dlmZmZ d d	lmZmZ d d
lmZmZ d dlmZ  e j<                  e«      Z g d¢Z!g d¢Z" G d„ d«      Z#y)é    N)ÚPath)ÚDictÚListÚUnion)Úfloat_to_float16_max_diff)Ú	OnnxModel)Úoptimize_model)Ú	T5DecoderÚT5DecoderHelperÚT5DecoderInit)Ú	T5EncoderÚT5EncoderHelper)ÚT5EncoderDecoderInitÚT5EncoderDecoderInitHelper)ÚMT5ForConditionalGenerationÚT5ForConditionalGeneration)ÚInferenceSession)zt5-smallzt5-basezt5-largezt5-3bzt5-11b)zgoogle/mt5-smallzgoogle/mt5-basezgoogle/mt5-largezgoogle/mt5-xlzgoogle/mt5-xxlc                   ó´  — e Zd Ze	 	 d"dededededef
d„«       Ze	 	 	 d#dededej                  d	ed
edede	eej                  j                  f   fd„«       Ze	 	 	 	 d$deeeeef   dej                  dededededefd„«       Zeg d¢fdedee   fd„«       Ze	 	 	 d%dedededededededefd„«       Zedeeeeef   dedej                  defd „«       Zy!)&ÚT5HelperÚ
output_dirÚmodel_name_or_pathÚsuffixÚ
new_folderÚreturnc                 ó6  — |}t         j                  j                  |«      rt        |«      j                  d   }n|j                  d«      d    ||z  }|r t         j                  j                  | |«      n| }t         j                  j                  ||dz   «      S )aÊ  Build onnx path

        Args:
            output_dir (str): output directory
            model_name_or_path (str): pretrained model name, or path to the model checkpoint
            suffix (str, optional): suffix like "_encoder" or "_decoder_fp16" will be appended to file name. Defaults to None.
            new_folder (bool, optional): create a new directory for the model. Defaults to False.

        Returns:
            str: path of onnx model
        éÿÿÿÿÚ/z.onnx)ÚosÚpathÚisdirr   ÚpartsÚsplitÚjoin)r   r   r   r   Ú
model_nameÚ	directorys         úa/var/www/openai/venv/lib/python3.12/site-packages/onnxruntime/transformers/models/t5/t5_helper.pyÚget_onnx_pathzT5Helper.get_onnx_path   s   € ð$ (ˆ
Ü7‰7=‰=Ð+Ô,ÜÐ0Ó1×7Ñ7¸Ñ;‰Jà×Ñ˜SÓ! "Ò%àfÑˆ
á<F”B—G‘G—L‘L ¨ZÔ8ÈJˆ	Üw‰w|‰|˜I z°GÑ';Ó<Ð<ó    Ú	cache_dirÚdeviceÚmerge_encoder_and_decoder_initÚ
model_typeÚstate_dict_pathc                 ó  — |dk(  rt        j                  | |¬«      }n(|dk(  rt        j                  | |¬«      }nt        d«      ‚|r$|j	                  t        j                  |«      «       t        |j                  |j                  |j                  «      }|j                  «       j                  |«       |r=t        |j                  |j                  |j                  |j                  d¬«      }||dœS t        |j                  |j                  «      }	|	j                  «       j                  |«       t!        |j                  |j                  |j                  «      }
|
j                  «       j                  |«       |	||
dœS )	ab  Load model given a pretrained name or path, then build models for ONNX conversion.

        Args:
            model_name_or_path (str): pretrained model name or path
            cache_dir (str): cache directory
            device (torch.device): device to run the model
            merge_encoder_and_decoder_init (bool, optional): Whether merge encoder and decoder initialization into one ONNX model. Defaults to True.
            is_mt5 (bool, optional): whether the model is MT5 instead of T5
        Returns:
            Dict[str, torch.nn.Module]: mapping from name to modules for ONNX conversion.
        Út5)r)   Úmt5z only support mode_type=t5 or mt5N)Údecoder_start_token_id)Úencoder_decoder_initÚdecoder)Úencoderr3   Údecoder_init)r   Úfrom_pretrainedr   Ú
ValueErrorÚload_state_dictÚtorchÚloadr
   r3   Úlm_headÚconfigÚevalÚtor   r4   r   r   )r   r)   r*   r+   r,   r-   Úmodelr3   r2   r4   r5   s              r&   Ú
load_modelzT5Helper.load_model;   s7  € ð( ˜ÒÜ.×>Ñ>Ð?QÐ]fÔg‰EØ˜5Ò Ü/×?Ñ?Ð@RÐ^gÔh‰EäÐ?Ó@Ð@áØ×!Ñ!¤%§*¡*¨_Ó"=Ô>ä˜EŸM™M¨5¯=©=¸%¿,¹,ÓGˆØ‰‹×Ñ˜&Ô!á)Ü#7Ø—‘Ø—‘Ø—‘Ø—‘Ø'+ô$Ð ð -AÈWÑUÐUä §¡¨u¯|©|Ó<ˆGØL‰L‹N×Ñ˜fÔ%Ü(¨¯©¸¿¹ÀuÇ|Á|ÓTˆLØ×ÑÓ×"Ñ" 6Ô*à"Ø"Ø ,ñð r(   r?   Úonnx_model_pathÚverboseÚuse_external_data_formatÚuse_decoder_input_idsÚuse_int32_inputsc           	      óæ   — t        | t        «      rt        j                  | |||||«       y t        | t        «      rt        j                  | ||||||«       y t        j                  | |||||«       y )N)Ú
isinstancer   r   Úexport_onnxr   r   r   )r?   r*   rA   rB   rC   rD   rE   s          r&   rH   zT5Helper.export_onnxp   s€   € ô eœYÔ'Ü×'Ñ'ØØØØØ(Ø õô ˜Ô3Ô4Ü&×2Ñ2ØØØØ%ØØ(Ø õô ×'Ñ'ØØØØØ(Ø õr(   )ÚSimplifiedLayerNormalizationÚ SkipSimplifiedLayerNormalizationÚReluÚAddÚ
onnx_modelÚop_block_listc                 ón  — | j                  «       D ch c]  }|j                  ’Œ }}t        |«      }|j                  |«      }t        j                  d|› d|› «       | j                  «       j                  d   j                  }d}| j                  «       }||v sJ ‚||   }d}	|j                  dk(  r‚|}	t        j                  d|j                  › «       d}
|j                  D ]  }| j                  |«      }
|
€Œ n t        |
«      }t        j                  d|j                  › d	|› «       |d
k  }n/t        j                  d|j                  › d|j                  › «       g }g }|s|	|g}|	j                  g}||||dœ}t        j                  d|› «        | j                  dddi|¤Ž |S c c}w )aë  Convert model to mixed precision.
           It detects whether original model has fp16 precision weights, and set parameters for float16 conversion automatically.
        Args:
            onnx_model (OnnxModel): optimized ONNX model
            op_block_list (List[str], optional): . Defaults to ["SimplifiedLayerNormalization", "SkipSimplifiedLayerNormalization", "Relu", "Add"]
        Returns:
            parameters(dict): a dictionary of parameters used in float16 conversion
        z	fp32 op: z
 fp16 op: r   FNÚMatMulz#Found last MatMul node for logits: z3max diff of converting weights in last MatMul node z: gíµ ÷Æ°>z-Failed to find MatMul node for logits. Found z	 of node )Úkeep_io_typesrN   Únode_block_listÚforce_fp16_initializersz!auto_mixed_precision parameters: Úuse_symbolic_shape_inferT© )ÚnodesÚop_typeÚsetÚ
differenceÚloggerÚinfoÚgraphÚoutputÚnameÚoutput_name_to_nodeÚinputÚget_initializerr   ÚdebugÚwarningÚconvert_float_to_float16)rM   rN   ÚnodeÚop_full_setÚfp32_op_setÚfp16_op_setÚlogits_output_nameÚis_weight_fp16_precisionr_   Úlast_matmul_nodeÚinitializerr`   Úmax_diffrQ   rR   Ú
parameterss                   r&   Úauto_mixed_precisionzT5Helper.auto_mixed_precision—   sà  € ð$ 1;×0@Ñ0@Ô0BÓCÑ0B¨t—|“|Ð0BˆÐCÜ˜-Ó(ˆØ!×,Ñ,¨[Ó9ˆÜ‰i ˜}¨J°{°mÐDÔEð (×-Ñ-Ó/×6Ñ6°qÑ9×>Ñ>Ðð $)Ð Ø(×<Ñ<Ó>ÐØ!Ð%8Ñ8Ð8Ð8Ø"Ð#5Ñ6ˆØÐØ<‰<˜8Ò#Ø#ÐÜK‰KÐ=¸d¿i¹i¸[ÐIÔJØˆKØŸœØ(×8Ñ8¸Ó?ØÑ*Ùð $ô 1°Ó=ˆHÜL‰LÐNÈtÏyÉyÈkÐY[Ð\dÐ[eÐfÔgØ'/°$¡Ñ$äN‰NÐJÈ4Ï<É<È.ÐXaÐbf×bkÑbkÐalÐmÔnàˆØˆÙ(Ð/?Ð/Kà/Ð0ˆMØ/×4Ñ4Ð5ˆOð +Ø*Ø.Ø'?ñ	
ˆ
ô 	‰Ð7¸
°|ÐDÔEØ+ˆ
×+Ñ+ÑXÀTÐXÈZÒXàÐùòa Ds   “F2Úoptimized_model_pathÚ
is_float16Únum_attention_headsÚhidden_sizero   Úuse_gpuc           
      óæ   — ddl m} d}	|r |d«      }	d|	_        t        | d|||sdnd|	d| ¬«      }
|r*|rt        j                  |
«       n|
j                  d¬«       |
j                  ||d	¬
«       y)zHOptimize ONNX model with an option to convert it to use mixed precision.r   )ÚFusionOptionsNr/   Fé   )r,   Ú	num_headsrs   Ú	opt_levelÚoptimization_optionsrt   Úonly_onnxruntime)Úcast_input_outputT)Úall_tensors_to_one_file)Úfusion_optionsrv   Úenable_skip_layer_normr	   r   ro   Ú convert_model_float32_to_float16Úsave_model_to_file)rA   rp   rq   rr   rs   rC   ro   rt   rv   rz   Úms              r&   Úoptimize_onnxzT5Helper.optimize_onnxÛ   s‹   € õ 	1à#ÐÙÙ#0°Ó#6Ð Ø:?Ð Ô7äØØØ)Ø#Ù7‘a¸QØ!5ØØ!(˜[ô	
ˆñ Ù#Ü×-Ñ-¨aÕ0à×2Ñ2ÀUÐ2ÔKà	×ÑÐ1Ð3KÐeiÐÕjr(   Úort_sessionc                 óÒ   — t        | t        «      rt        j                  | |||«      S t        | t        «      rt        j                  | |||«      S t        j                  | |||«      S )zQCompare the result from PyTorch and OnnxRuntime to verify the ONNX model is good.)rG   r   r   Úverify_onnxr   r   r   )r?   r„   r*   rE   s       r&   r†   zT5Helper.verify_onnx  sa   € ô eœYÔ'Ü"×.Ñ.¨u°kÀ6ÐK[Ó\Ð\äeÔ1Ô2Ü-×9Ñ9¸%ÀÈfÐVfÓgÐgä×*Ñ*¨5°+¸vÐGWÓXÐXr(   N)Ú F)Tr/   r‡   )TFTF)FTF)Ú__name__Ú
__module__Ú__qualname__ÚstaticmethodÚstrÚboolr'   r9   r*   r   ÚnnÚModuler@   r   r   r
   r   r   rH   r   r   ro   Úintrƒ   r   r†   rU   r(   r&   r   r      s3  „ Øð Ø ñ	=Øð=àð=ð ð=ð ð	=ð
 
ò=ó ð=ð8 ð
 04ØØ!ñ2Øð2àð2ð —‘ð2ð )-ð	2ð
 ð2ð ð2ð 
ˆc5—8‘8—?‘?Ð"Ñ	#ò2ó ð2ðh ð
 Ø).Ø&*Ø!&ñ$ØY 	¨=Ð:NÐNÑOð$à—‘ð$ð ð$ð ð	$ð
 #'ð$ð  $ð$ð ò$ó ð$ðL ò$
ñAØðAà˜C‘yòAó ðAðF ð */Ø%)Øñ$kØð$kà!ð$kð ð$kð !ð	$kð
 ð$kð #'ð$kð #ð$kð ò$kó ð$kðL ðYØY 	¨=Ð:NÐNÑOðYà%ðYð —‘ðYð ò	Yó ñYr(   r   )$Úloggingr   Úpathlibr   Útypingr   r   r   r9   Úfloat16r   rM   r   Ú	optimizerr	   Ú
t5_decoderr
   r   r   Ú
t5_encoderr   r   Út5_encoder_decoder_initr   r   Útransformersr   r   Úonnxruntimer   Ú	getLoggerrˆ   rZ   ÚPRETRAINED_T5_MODELSÚPRETRAINED_MT5_MODELSr   rU   r(   r&   Ú<module>rž      s`   ðó Û 	Ý ß $Ñ $ã Ý -Ý  Ý $ß @Ñ @ß 1ß Tß På (à	ˆ×	Ñ	˜8Ó	$€âMÐ ÚvÐ ÷sYò sYr(   