hai 10 meses · ba67206bb9
--- a/api/core/model_runtime/model_providers/azure_openai/llm/llm.py
+++ b/api/core/model_runtime/model_providers/azure_openai/llm/llm.py
@@ -1,14 +1,13 @@
 
															 import copy
														
 
															 import logging
														
 
															-from collections.abc import Generator
														
 
															+from collections.abc import Generator, Sequence
														
 
															 from typing import Optional, Union, cast
														
 
															 import tiktoken
														
 
															 from openai import AzureOpenAI, Stream
														
 
															 from openai.types import Completion
														
 
															 from openai.types.chat import ChatCompletion, ChatCompletionChunk, ChatCompletionMessageToolCall
														
 
															-from openai.types.chat.chat_completion_chunk import ChoiceDeltaFunctionCall, ChoiceDeltaToolCall
														
 
															-from openai.types.chat.chat_completion_message import FunctionCall
														
 
															+from openai.types.chat.chat_completion_chunk import ChoiceDeltaToolCall
														
 
															 from core.model_runtime.entities.llm_entities import LLMMode, LLMResult, LLMResultChunk, LLMResultChunkDelta
														
 
															 from core.model_runtime.entities.message_entities import (
														
@@ -16,6 +15,7 @@ from core.model_runtime.entities.message_entities import (
 
															     ImagePromptMessageContent,
														
 
															     PromptMessage,
														
 
															     PromptMessageContentType,
														
 
															+    PromptMessageFunction,
														
 
															     PromptMessageTool,
														
 
															     SystemPromptMessage,
														
 
															     TextPromptMessageContent,
														
@@ -26,7 +26,8 @@ from core.model_runtime.entities.model_entities import AIModelEntity, ModelPrope
 
															 from core.model_runtime.errors.validate import CredentialsValidateFailedError
														
 
															 from core.model_runtime.model_providers.__base.large_language_model import LargeLanguageModel
														
 
															 from core.model_runtime.model_providers.azure_openai._common import _CommonAzureOpenAI
														
 
															-from core.model_runtime.model_providers.azure_openai._constant import LLM_BASE_MODELS, AzureBaseModel
														
 
															+from core.model_runtime.model_providers.azure_openai._constant import LLM_BASE_MODELS
														
 
															+from core.model_runtime.utils import helper
														
 
															 logger = logging.getLogger(__name__)
														
@@ -39,9 +40,12 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                 stream: bool = True, user: Optional[str] = None) \
														
 
															             -> Union[LLMResult, Generator]:
														
 
															-        ai_model_entity = self._get_ai_model_entity(credentials.get('base_model_name'), model)
														
 
															+        base_model_name = credentials.get('base_model_name')
														
 
															+        if not base_model_name:
														
 
															+            raise ValueError('Base Model Name is required')
														
 
															+        ai_model_entity = self._get_ai_model_entity(base_model_name=base_model_name, model=model)
														
 
															-        if ai_model_entity.entity.model_properties.get(ModelPropertyKey.MODE) == LLMMode.CHAT.value:
														
 
															+        if ai_model_entity and ai_model_entity.entity.model_properties.get(ModelPropertyKey.MODE) == LLMMode.CHAT.value:
														
 
															             # chat model
														
 
															             return self._chat_generate(
														
 
															                 model=model,
														
@@ -65,18 +69,29 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                 user=user
														
 
															             )
														
 
															-    def get_num_tokens(self, model: str, credentials: dict, prompt_messages: list[PromptMessage],
														
 
															-                       tools: Optional[list[PromptMessageTool]] = None) -> int:
														
 
															-
														
 
															-        model_mode = self._get_ai_model_entity(credentials.get('base_model_name'), model).entity.model_properties.get(
														
 
															-            ModelPropertyKey.MODE)
														
 
															+    def get_num_tokens(
														
 
															+        self,
														
 
															+        model: str,
														
 
															+        credentials: dict,
														
 
															+        prompt_messages: list[PromptMessage],
														
 
															+        tools: Optional[list[PromptMessageTool]] = None
														
 
															+    ) -> int:
														
 
															+        base_model_name = credentials.get('base_model_name')
														
 
															+        if not base_model_name:
														
 
															+            raise ValueError('Base Model Name is required')
														
 
															+        model_entity = self._get_ai_model_entity(base_model_name=base_model_name, model=model)
														
 
															+        if not model_entity:
														
 
															+            raise ValueError(f'Base Model Name {base_model_name} is invalid')
														
 
															+        model_mode = model_entity.entity.model_properties.get(ModelPropertyKey.MODE)
														
 
															         if model_mode == LLMMode.CHAT.value:
														
 
															             # chat model
														
 
															             return self._num_tokens_from_messages(credentials, prompt_messages, tools)
														
 
															         else:
														
 
															             # text completion model, do not support tool calling
														
 
															-            return self._num_tokens_from_string(credentials, prompt_messages[0].content)
														
 
															+            content = prompt_messages[0].content
														
 
															+            assert isinstance(content, str)
														
 
															+            return self._num_tokens_from_string(credentials,content)
														
 
															     def validate_credentials(self, model: str, credentials: dict) -> None:
														
 
															         if 'openai_api_base' not in credentials:
														
@@ -88,7 +103,10 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         if 'base_model_name' not in credentials:
														
 
															             raise CredentialsValidateFailedError('Base Model Name is required')
														
 
															-        ai_model_entity = self._get_ai_model_entity(credentials.get('base_model_name'), model)
														
 
															+        base_model_name = credentials.get('base_model_name')
														
 
															+        if not base_model_name:
														
 
															+            raise CredentialsValidateFailedError('Base Model Name is required')
														
 
															+        ai_model_entity = self._get_ai_model_entity(base_model_name=base_model_name, model=model)
														
 
															         if not ai_model_entity:
														
 
															             raise CredentialsValidateFailedError(f'Base Model Name {credentials["base_model_name"]} is invalid')
														
@@ -118,7 +136,10 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															             raise CredentialsValidateFailedError(str(ex))
														
 
															     def get_customizable_model_schema(self, model: str, credentials: dict) -> Optional[AIModelEntity]:
														
 
															-        ai_model_entity = self._get_ai_model_entity(credentials.get('base_model_name'), model)
														
 
															+        base_model_name = credentials.get('base_model_name')
														
 
															+        if not base_model_name:
														
 
															+            raise ValueError('Base Model Name is required')
														
 
															+        ai_model_entity = self._get_ai_model_entity(base_model_name=base_model_name, model=model)
														
 
															         return ai_model_entity.entity if ai_model_entity else None
														
 
															     def _generate(self, model: str, credentials: dict,
														
@@ -149,8 +170,10 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         return self._handle_generate_response(model, credentials, response, prompt_messages)
														
 
															-    def _handle_generate_response(self, model: str, credentials: dict, response: Completion,
														
 
															-                                  prompt_messages: list[PromptMessage]) -> LLMResult:
														
 
															+    def _handle_generate_response(
														
 
															+        self, model: str, credentials: dict, response: Completion,
														
 
															+        prompt_messages: list[PromptMessage]
														
 
															+    ):
														
 
															         assistant_text = response.choices[0].text
														
 
															         # transform assistant message to prompt message
														
@@ -165,7 +188,9 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															             completion_tokens = response.usage.completion_tokens
														
 
															         else:
														
 
															             # calculate num tokens
														
 
															-            prompt_tokens = self._num_tokens_from_string(credentials, prompt_messages[0].content)
														
 
															+            content = prompt_messages[0].content
														
 
															+            assert isinstance(content, str)
														
 
															+            prompt_tokens = self._num_tokens_from_string(credentials, content)
														
 
															             completion_tokens = self._num_tokens_from_string(credentials, assistant_text)
														
 
															         # transform usage
														
@@ -182,8 +207,10 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         return result
														
 
															-    def _handle_generate_stream_response(self, model: str, credentials: dict, response: Stream[Completion],
														
 
															-                                         prompt_messages: list[PromptMessage]) -> Generator:
														
 
															+    def _handle_generate_stream_response(
														
 
															+        self, model: str, credentials: dict, response: Stream[Completion],
														
 
															+        prompt_messages: list[PromptMessage]
														
 
															+    ) -> Generator:
														
 
															         full_text = ''
														
 
															         for chunk in response:
														
 
															             if len(chunk.choices) == 0:
														
@@ -210,7 +237,9 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                     completion_tokens = chunk.usage.completion_tokens
														
 
															                 else:
														
 
															                     # calculate num tokens
														
 
															-                    prompt_tokens = self._num_tokens_from_string(credentials, prompt_messages[0].content)
														
 
															+                    content = prompt_messages[0].content
														
 
															+                    assert isinstance(content, str)
														
 
															+                    prompt_tokens = self._num_tokens_from_string(credentials, content)
														
 
															                     completion_tokens = self._num_tokens_from_string(credentials, full_text)
														
 
															                 # transform usage
														
@@ -257,12 +286,12 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         extra_model_kwargs = {}
														
 
															         if tools:
														
 
															-            # extra_model_kwargs['tools'] = [helper.dump_model(PromptMessageFunction(function=tool)) for tool in tools]
														
 
															-            extra_model_kwargs['functions'] = [{
														
 
															-                "name": tool.name,
														
 
															-                "description": tool.description,
														
 
															-                "parameters": tool.parameters
														
 
															-            } for tool in tools]
														
 
															+            extra_model_kwargs['tools'] = [helper.dump_model(PromptMessageFunction(function=tool)) for tool in tools]
														
 
															+            # extra_model_kwargs['functions'] = [{
														
 
															+            #     "name": tool.name,
														
 
															+            #     "description": tool.description,
														
 
															+            #     "parameters": tool.parameters
														
 
															+            # } for tool in tools]
														
 
															         if stop:
														
 
															             extra_model_kwargs['stop'] = stop
														
@@ -271,8 +300,9 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															             extra_model_kwargs['user'] = user
														
 
															         # chat model
														
 
															+        messages = [self._convert_prompt_message_to_dict(m) for m in prompt_messages]
														
 
															         response = client.chat.completions.create(
														
 
															-            messages=[self._convert_prompt_message_to_dict(m) for m in prompt_messages],
														
 
															+            messages=messages,
														
 
															             model=model,
														
 
															             stream=stream,
														
 
															             **model_parameters,
														
@@ -284,18 +314,17 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         return self._handle_chat_generate_response(model, credentials, response, prompt_messages, tools)
														
 
															-    def _handle_chat_generate_response(self, model: str, credentials: dict, response: ChatCompletion,
														
 
															-                                       prompt_messages: list[PromptMessage],
														
 
															-                                       tools: Optional[list[PromptMessageTool]] = None) -> LLMResult:
														
 
															-
														
 
															+    def _handle_chat_generate_response(
														
 
															+        self, model: str, credentials: dict, response: ChatCompletion,
														
 
															+        prompt_messages: list[PromptMessage],
														
 
															+        tools: Optional[list[PromptMessageTool]] = None
														
 
															+    ):
														
 
															         assistant_message = response.choices[0].message
														
 
															-        # assistant_message_tool_calls = assistant_message.tool_calls
														
 
															-        assistant_message_function_call = assistant_message.function_call
														
 
															+        assistant_message_tool_calls = assistant_message.tool_calls
														
 
															         # extract tool calls from response
														
 
															-        # tool_calls = self._extract_response_tool_calls(assistant_message_tool_calls)
														
 
															-        function_call = self._extract_response_function_call(assistant_message_function_call)
														
 
															-        tool_calls = [function_call] if function_call else []
														
 
															+        tool_calls = []
														
 
															+        self._update_tool_calls(tool_calls=tool_calls, tool_calls_response=assistant_message_tool_calls)
														
 
															         # transform assistant message to prompt message
														
 
															         assistant_prompt_message = AssistantPromptMessage(
														
@@ -317,7 +346,7 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         usage = self._calc_response_usage(model, credentials, prompt_tokens, completion_tokens)
														
 
															         # transform response
														
 
															-        response = LLMResult(
														
 
															+        result = LLMResult(
														
 
															             model=response.model or model,
														
 
															             prompt_messages=prompt_messages,
														
 
															             message=assistant_prompt_message,
														
@@ -325,58 +354,34 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															             system_fingerprint=response.system_fingerprint,
														
 
															         )
														
 
															-        return response
														
 
															+        return result
														
 
															-    def _handle_chat_generate_stream_response(self, model: str, credentials: dict,
														
 
															-                                              response: Stream[ChatCompletionChunk],
														
 
															-                                              prompt_messages: list[PromptMessage],
														
 
															-                                              tools: Optional[list[PromptMessageTool]] = None) -> Generator:
														
 
															+    def _handle_chat_generate_stream_response(
														
 
															+        self,
														
 
															+        model: str,
														
 
															+        credentials: dict,
														
 
															+        response: Stream[ChatCompletionChunk],
														
 
															+        prompt_messages: list[PromptMessage],
														
 
															+        tools: Optional[list[PromptMessageTool]] = None
														
 
															+    ):
														
 
															         index = 0
														
 
															         full_assistant_content = ''
														
 
															-        delta_assistant_message_function_call_storage: ChoiceDeltaFunctionCall = None
														
 
															         real_model = model
														
 
															         system_fingerprint = None
														
 
															         completion = ''
														
 
															+        tool_calls = []
														
 
															         for chunk in response:
														
 
															             if len(chunk.choices) == 0:
														
 
															                 continue
														
 
															             delta = chunk.choices[0]
														
 
															-            # Handling exceptions when content filters' streaming mode is set to asynchronous modified filter
														
 
															-            if delta.delta is None or (
														
 
															-                delta.finish_reason is None
														
 
															-                and (delta.delta.content is None or delta.delta.content == '')
														
 
															-                and delta.delta.function_call is None
														
 
															-            ):
														
 
															-                continue
														
 
															-            
														
 
															-            # assistant_message_tool_calls = delta.delta.tool_calls
														
 
															-            assistant_message_function_call = delta.delta.function_call
														
 
															-
														
 
															             # extract tool calls from response
														
 
															-            if delta_assistant_message_function_call_storage is not None:
														
 
															-                # handle process of stream function call
														
 
															-                if assistant_message_function_call:
														
 
															-                    # message has not ended ever
														
 
															-                    delta_assistant_message_function_call_storage.arguments += assistant_message_function_call.arguments
														
 
															-                    continue
														
 
															-                else:
														
 
															-                    # message has ended
														
 
															-                    assistant_message_function_call = delta_assistant_message_function_call_storage
														
 
															-                    delta_assistant_message_function_call_storage = None
														
 
															-            else:
														
 
															-                if assistant_message_function_call:
														
 
															-                    # start of stream function call
														
 
															-                    delta_assistant_message_function_call_storage = assistant_message_function_call
														
 
															-                    if delta_assistant_message_function_call_storage.arguments is None:
														
 
															-                        delta_assistant_message_function_call_storage.arguments = ''
														
 
															-                    continue
														
 
															+            self._update_tool_calls(tool_calls=tool_calls, tool_calls_response=delta.delta.tool_calls)
														
 
															-            # extract tool calls from response
														
 
															-            # tool_calls = self._extract_response_tool_calls(assistant_message_tool_calls)
														
 
															-            function_call = self._extract_response_function_call(assistant_message_function_call)
														
 
															-            tool_calls = [function_call] if function_call else []
														
 
															+            # Handling exceptions when content filters' streaming mode is set to asynchronous modified filter
														
 
															+            if delta.finish_reason is None and not delta.delta.content:
														
 
															+                continue
														
 
															             # transform assistant message to prompt message
														
 
															             assistant_prompt_message = AssistantPromptMessage(
														
@@ -426,54 +431,56 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         )
														
 
															     @staticmethod
														
 
															-    def _extract_response_tool_calls(response_tool_calls: list[ChatCompletionMessageToolCall | ChoiceDeltaToolCall]) \
														
 
															-            -> list[AssistantPromptMessage.ToolCall]:
														
 
															-
														
 
															-        tool_calls = []
														
 
															-        if response_tool_calls:
														
 
															-            for response_tool_call in response_tool_calls:
														
 
															-                function = AssistantPromptMessage.ToolCall.ToolCallFunction(
														
 
															-                    name=response_tool_call.function.name,
														
 
															-                    arguments=response_tool_call.function.arguments
														
 
															-                )
														
 
															-
														
 
															-                tool_call = AssistantPromptMessage.ToolCall(
														
 
															-                    id=response_tool_call.id,
														
 
															-                    type=response_tool_call.type,
														
 
															-                    function=function
														
 
															-                )
														
 
															-                tool_calls.append(tool_call)
														
 
															-
														
 
															-        return tool_calls
														
 
															-
														
 
															-    @staticmethod
														
 
															-    def _extract_response_function_call(response_function_call: FunctionCall | ChoiceDeltaFunctionCall) \
														
 
															-            -> AssistantPromptMessage.ToolCall:
														
 
															-
														
 
															-        tool_call = None
														
 
															-        if response_function_call:
														
 
															-            function = AssistantPromptMessage.ToolCall.ToolCallFunction(
														
 
															-                name=response_function_call.name,
														
 
															-                arguments=response_function_call.arguments
														
 
															-            )
														
 
															-
														
 
															-            tool_call = AssistantPromptMessage.ToolCall(
														
 
															-                id=response_function_call.name,
														
 
															-                type="function",
														
 
															-                function=function
														
 
															-            )
														
 
															+    def _update_tool_calls(tool_calls: list[AssistantPromptMessage.ToolCall], tool_calls_response: Optional[Sequence[ChatCompletionMessageToolCall | ChoiceDeltaToolCall]]) -> None:
														
 
															+        if tool_calls_response:
														
 
															+            for response_tool_call in tool_calls_response:
														
 
															+                if isinstance(response_tool_call, ChatCompletionMessageToolCall):
														
 
															+                    function = AssistantPromptMessage.ToolCall.ToolCallFunction(
														
 
															+                        name=response_tool_call.function.name,
														
 
															+                        arguments=response_tool_call.function.arguments
														
 
															+                    )
														
 
															-        return tool_call
														
 
															+                    tool_call = AssistantPromptMessage.ToolCall(
														
 
															+                        id=response_tool_call.id,
														
 
															+                        type=response_tool_call.type,
														
 
															+                        function=function
														
 
															+                    )
														
 
															+                    tool_calls.append(tool_call)
														
 
															+                elif isinstance(response_tool_call, ChoiceDeltaToolCall):
														
 
															+                    index = response_tool_call.index
														
 
															+                    if index < len(tool_calls):
														
 
															+                        tool_calls[index].id = response_tool_call.id or tool_calls[index].id
														
 
															+                        tool_calls[index].type = response_tool_call.type or tool_calls[index].type
														
 
															+                        if response_tool_call.function:
														
 
															+                            tool_calls[index].function.name = response_tool_call.function.name or tool_calls[index].function.name
														
 
															+                            tool_calls[index].function.arguments += response_tool_call.function.arguments or ''
														
 
															+                    else:
														
 
															+                        assert response_tool_call.id is not None
														
 
															+                        assert response_tool_call.type is not None
														
 
															+                        assert response_tool_call.function is not None
														
 
															+                        assert response_tool_call.function.name is not None
														
 
															+                        assert response_tool_call.function.arguments is not None
														
 
															+
														
 
															+                        function = AssistantPromptMessage.ToolCall.ToolCallFunction(
														
 
															+                            name=response_tool_call.function.name,
														
 
															+                            arguments=response_tool_call.function.arguments
														
 
															+                        )
														
 
															+                        tool_call = AssistantPromptMessage.ToolCall(
														
 
															+                            id=response_tool_call.id,
														
 
															+                            type=response_tool_call.type,
														
 
															+                            function=function
														
 
															+                        )
														
 
															+                        tool_calls.append(tool_call)
														
 
															     @staticmethod
														
 
															-    def _convert_prompt_message_to_dict(message: PromptMessage) -> dict:
														
 
															-
														
 
															+    def _convert_prompt_message_to_dict(message: PromptMessage):
														
 
															         if isinstance(message, UserPromptMessage):
														
 
															             message = cast(UserPromptMessage, message)
														
 
															             if isinstance(message.content, str):
														
 
															                 message_dict = {"role": "user", "content": message.content}
														
 
															             else:
														
 
															                 sub_messages = []
														
 
															+                assert message.content is not None
														
 
															                 for message_content in message.content:
														
 
															                     if message_content.type == PromptMessageContentType.TEXT:
														
 
															                         message_content = cast(TextPromptMessageContent, message_content)
														
@@ -492,33 +499,22 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                             }
														
 
															                         }
														
 
															                         sub_messages.append(sub_message_dict)
														
 
															-
														
 
															                 message_dict = {"role": "user", "content": sub_messages}
														
 
															         elif isinstance(message, AssistantPromptMessage):
														
 
															             message = cast(AssistantPromptMessage, message)
														
 
															             message_dict = {"role": "assistant", "content": message.content}
														
 
															             if message.tool_calls:
														
 
															-                # message_dict["tool_calls"] = [helper.dump_model(tool_call) for tool_call in
														
 
															-                #                               message.tool_calls]
														
 
															-                function_call = message.tool_calls[0]
														
 
															-                message_dict["function_call"] = {
														
 
															-                    "name": function_call.function.name,
														
 
															-                    "arguments": function_call.function.arguments,
														
 
															-                }
														
 
															+                message_dict["tool_calls"] = [helper.dump_model(tool_call) for tool_call in message.tool_calls]
														
 
															         elif isinstance(message, SystemPromptMessage):
														
 
															             message = cast(SystemPromptMessage, message)
														
 
															             message_dict = {"role": "system", "content": message.content}
														
 
															         elif isinstance(message, ToolPromptMessage):
														
 
															             message = cast(ToolPromptMessage, message)
														
 
															-            # message_dict = {
														
 
															-            #     "role": "tool",
														
 
															-            #     "content": message.content,
														
 
															-            #     "tool_call_id": message.tool_call_id
														
 
															-            # }
														
 
															             message_dict = {
														
 
															-                "role": "function",
														
 
															+                "role": "tool",
														
 
															+                "name": message.name,
														
 
															                 "content": message.content,
														
 
															-                "name": message.tool_call_id
														
 
															+                "tool_call_id": message.tool_call_id
														
 
															             }
														
 
															         else:
														
 
															             raise ValueError(f"Got unknown type {message}")
														
@@ -542,8 +538,10 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         return num_tokens
														
 
															-    def _num_tokens_from_messages(self, credentials: dict, messages: list[PromptMessage],
														
 
															-                                  tools: Optional[list[PromptMessageTool]] = None) -> int:
														
 
															+    def _num_tokens_from_messages(
														
 
															+        self, credentials: dict, messages: list[PromptMessage],
														
 
															+        tools: Optional[list[PromptMessageTool]] = None
														
 
															+    ) -> int:
														
 
															         """Calculate num tokens for gpt-3.5-turbo and gpt-4 with tiktoken package.
														
 
															         Official documentation: https://github.com/openai/openai-cookbook/blob/
														
@@ -591,6 +589,7 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                 if key == "tool_calls":
														
 
															                     for tool_call in value:
														
 
															+                        assert isinstance(tool_call, dict)
														
 
															                         for t_key, t_value in tool_call.items():
														
 
															                             num_tokens += len(encoding.encode(t_key))
														
 
															                             if t_key == "function":
														
@@ -631,12 +630,12 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															             num_tokens += len(encoding.encode('parameters'))
														
 
															             if 'title' in parameters:
														
 
															                 num_tokens += len(encoding.encode('title'))
														
 
															-                num_tokens += len(encoding.encode(parameters.get("title")))
														
 
															+                num_tokens += len(encoding.encode(parameters['title']))
														
 
															             num_tokens += len(encoding.encode('type'))
														
 
															-            num_tokens += len(encoding.encode(parameters.get("type")))
														
 
															+            num_tokens += len(encoding.encode(parameters['type']))
														
 
															             if 'properties' in parameters:
														
 
															                 num_tokens += len(encoding.encode('properties'))
														
 
															-                for key, value in parameters.get('properties').items():
														
 
															+                for key, value in parameters['properties'].items():
														
 
															                     num_tokens += len(encoding.encode(key))
														
 
															                     for field_key, field_value in value.items():
														
 
															                         num_tokens += len(encoding.encode(field_key))
														
@@ -656,7 +655,7 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															         return num_tokens
														
 
															     @staticmethod
														
 
															-    def _get_ai_model_entity(base_model_name: str, model: str) -> AzureBaseModel:
														
 
															+    def _get_ai_model_entity(base_model_name: str, model: str):
														
 
															         for ai_model_entity in LLM_BASE_MODELS:
														
 
															             if ai_model_entity.base_model_name == base_model_name:
														
 
															                 ai_model_entity_copy = copy.deepcopy(ai_model_entity)
														
@@ -664,5 +663,3 @@ class AzureOpenAILargeLanguageModel(_CommonAzureOpenAI, LargeLanguageModel):
 
															                 ai_model_entity_copy.entity.label.en_US = model
														
 
															                 ai_model_entity_copy.entity.label.zh_Hans = model
														
 
															                 return ai_model_entity_copy
														
 
															-
														
 
															-        return None
														
--- a/api/tests/integration_tests/model_runtime/__mock/openai_chat.py
+++ b/api/tests/integration_tests/model_runtime/__mock/openai_chat.py
@@ -73,17 +73,15 @@ class MockChatClass:
 
															         return FunctionCall(name=function_name, arguments=dumps(parameters))
														
 
															     @staticmethod
														
 
															-    def generate_tool_calls(
														
 
															-        tools: list[ChatCompletionToolParam] | NotGiven = NOT_GIVEN,
														
 
															-    ) -> Optional[list[ChatCompletionMessageToolCall]]:
														
 
															+    def generate_tool_calls(tools = NOT_GIVEN) -> Optional[list[ChatCompletionMessageToolCall]]:
														
 
															         list_tool_calls = []
														
 
															         if not tools or len(tools) == 0:
														
 
															             return None
														
 
															-        tool: ChatCompletionToolParam = tools[0]
														
 
															+        tool = tools[0]
														
 
															-        if tools['type'] != 'function':
														
 
															+        if 'type' in tools and tools['type'] != 'function':
														
 
															             return None
														
 
															-        
														
 
															+
														
 
															         function = tool['function']
														
 
															         function_call = MockChatClass.generate_function_call(functions=[function])