mega changes

2026-01-06 09:14:39 +01:00 · 2025-11-20 11:11:18 +01:00
parent e070c95190
commit 841d79f26b
138 changed files with 21499 additions and 8844 deletions
--- a/backend/app/services/llm/service.py
+++ b/backend/app/services/llm/service.py
@@ -12,18 +12,28 @@ from typing import Dict, Any, Optional, List, AsyncGenerator
 from datetime import datetime

 from .models import (
-    ChatRequest, ChatResponse, EmbeddingRequest, EmbeddingResponse,
-    ModelInfo, ProviderStatus, LLMMetrics
+    ChatRequest,
+    ChatResponse,
+    EmbeddingRequest,
+    EmbeddingResponse,
+    ModelInfo,
+    ProviderStatus,
+    LLMMetrics,
 )
 from .config import config_manager, ProviderConfig
 from ...core.config import settings

 from .resilience import ResilienceManagerFactory
+
 # from .metrics import metrics_collector
 from .providers import BaseLLMProvider, PrivateModeProvider
 from .exceptions import (
-    LLMError, ProviderError, SecurityError, ConfigurationError,
-    ValidationError, TimeoutError
+    LLMError,
+    ProviderError,
+    SecurityError,
+    ConfigurationError,
+    ValidationError,
+    TimeoutError,
 )

 logger = logging.getLogger(__name__)
@@ -31,58 +41,64 @@ logger = logging.getLogger(__name__)

 class LLMService:
    """Main LLM service coordinating all components"""
-    
+
    def __init__(self):
        """Initialize LLM service"""
        self._providers: Dict[str, BaseLLMProvider] = {}
        self._initialized = False
        self._startup_time: Optional[datetime] = None
-        
+
        logger.info("LLM Service initialized")
-    
+
    async def initialize(self):
        """Initialize service and providers"""
        if self._initialized:
            logger.warning("LLM Service already initialized")
            return
-        
+
        start_time = time.time()
        self._startup_time = datetime.utcnow()
-        
+
        try:
            # Get configuration
            config = config_manager.get_config()
-            logger.info(f"Initializing LLM service with {len(config.providers)} configured providers")
-            
+            logger.info(
+                f"Initializing LLM service with {len(config.providers)} configured providers"
+            )
+
            # Initialize enabled providers
            enabled_providers = config_manager.get_enabled_providers()
            if not enabled_providers:
                raise ConfigurationError("No enabled providers found")
-            
+
            for provider_name in enabled_providers:
                await self._initialize_provider(provider_name)
-            
+
            # Verify we have at least one working provider
            if not self._providers:
                raise ConfigurationError("No providers successfully initialized")
-            
+
            # Verify default provider is available
            default_provider = config.default_provider
            if default_provider not in self._providers:
                available_providers = list(self._providers.keys())
-                logger.warning(f"Default provider '{default_provider}' not available, using '{available_providers[0]}'")
+                logger.warning(
+                    f"Default provider '{default_provider}' not available, using '{available_providers[0]}'"
+                )
                config.default_provider = available_providers[0]
-            
+
            self._initialized = True
            initialization_time = (time.time() - start_time) * 1000
-            
-            logger.info(f"LLM Service initialized successfully in {initialization_time:.2f}ms")
+
+            logger.info(
+                f"LLM Service initialized successfully in {initialization_time:.2f}ms"
+            )
            logger.info(f"Available providers: {list(self._providers.keys())}")
-            
+
        except Exception as e:
            logger.error(f"Failed to initialize LLM service: {e}")
            raise ConfigurationError(f"LLM service initialization failed: {e}")
-    
+
    async def _initialize_provider(self, provider_name: str):
        """Initialize a specific provider"""
        try:
@@ -90,101 +106,109 @@ class LLMService:
            if not provider_config or not provider_config.enabled:
                logger.warning(f"Provider '{provider_name}' not enabled, skipping")
                return
-            
+
            # Get API key
            api_key = config_manager.get_api_key(provider_name)
            if not api_key:
                logger.error(f"No API key found for provider '{provider_name}'")
                return
-            
+
            # Create provider instance
            provider = self._create_provider(provider_config, api_key)
-            
+
            # Initialize provider
            await provider.initialize()
-            
+
            # Test provider health
            health_status = await provider.health_check()
            if health_status.status == "unavailable":
-                logger.error(f"Provider '{provider_name}' failed health check: {health_status.error_message}")
+                logger.error(
+                    f"Provider '{provider_name}' failed health check: {health_status.error_message}"
+                )
                return
-            
+
            # Register provider
            self._providers[provider_name] = provider
-            logger.info(f"Provider '{provider_name}' initialized successfully (status: {health_status.status})")
-            
+            logger.info(
+                f"Provider '{provider_name}' initialized successfully (status: {health_status.status})"
+            )
+
            # Fetch and update models dynamically
            await self._refresh_provider_models(provider_name, provider)
-            
+
        except Exception as e:
            logger.error(f"Failed to initialize provider '{provider_name}': {e}")
-    
+
    def _create_provider(self, config: ProviderConfig, api_key: str) -> BaseLLMProvider:
        """Create provider instance based on configuration"""
        if config.name == "privatemode":
            return PrivateModeProvider(config, api_key)
        else:
            raise ConfigurationError(f"Unknown provider type: {config.name}")
-    
-    async def _refresh_provider_models(self, provider_name: str, provider: BaseLLMProvider):
+
+    async def _refresh_provider_models(
+        self, provider_name: str, provider: BaseLLMProvider
+    ):
        """Fetch and update models dynamically from provider"""
        try:
            # Get models from provider
            models = await provider.get_models()
            model_ids = [model.id for model in models]
-            
+
            # Update configuration
            await config_manager.refresh_provider_models(provider_name, model_ids)
-            
-            logger.info(f"Refreshed {len(model_ids)} models for provider '{provider_name}': {model_ids}")
-            
+
+            logger.info(
+                f"Refreshed {len(model_ids)} models for provider '{provider_name}': {model_ids}"
+            )
+
        except Exception as e:
-            logger.error(f"Failed to refresh models for provider '{provider_name}': {e}")
-    
+            logger.error(
+                f"Failed to refresh models for provider '{provider_name}': {e}"
+            )
+
    async def create_chat_completion(self, request: ChatRequest) -> ChatResponse:
        """Create chat completion with security and resilience"""
        if not self._initialized:
            await self.initialize()
-        
+
        # Validate request
        if not request.messages:
            raise ValidationError("Messages cannot be empty", field="messages")
-        
+
        risk_score = 0.0
-        
+
        # Get provider for model
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)
-        
+
        if not provider:
-            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)
-        
-        
+            raise ProviderError(
+                f"No available provider for model '{request.model}'",
+                provider=provider_name,
+            )
+
        # Execute with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)
        start_time = time.time()
-        
+
        try:
            response = await resilience_manager.execute(
                provider.create_chat_completion,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
-                non_retryable_exceptions=(ValidationError,)
+                non_retryable_exceptions=(ValidationError,),
            )
-            

-
-            
            # Record successful request - metrics disabled
            total_latency = (time.time() - start_time) * 1000
-      
-            
+
            return response
-        
+
        except Exception as e:
            # Record failed request - metrics disabled
            total_latency = (time.time() - start_time) * 1000
-            error_code = getattr(e, 'error_code', e.__class__.__name__)
+            error_code = getattr(e, "error_code", e.__class__.__name__)

            logger.exception(
                "Chat completion failed for provider %s (model=%s, latency=%.2fms, error=%s)",
@@ -194,38 +218,42 @@ class LLMService:
                error_code,
            )
            raise
-    
-    async def create_chat_completion_stream(self, request: ChatRequest) -> AsyncGenerator[Dict[str, Any], None]:
+
+    async def create_chat_completion_stream(
+        self, request: ChatRequest
+    ) -> AsyncGenerator[Dict[str, Any], None]:
        """Create streaming chat completion"""
        if not self._initialized:
            await self.initialize()
-        
+
        # Security validation disabled - always allow streaming requests
        risk_score = 0.0

-        
        # Get provider
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)
-        
+
        if not provider:
-            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)
-        
+            raise ProviderError(
+                f"No available provider for model '{request.model}'",
+                provider=provider_name,
+            )
+
        # Execute streaming with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)
-        
+
        try:
            async for chunk in await resilience_manager.execute(
                provider.create_chat_completion_stream,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
-                non_retryable_exceptions=(ValidationError,)
+                non_retryable_exceptions=(ValidationError,),
            ):
                yield chunk
-        
+
        except Exception as e:
            # Record streaming failure - metrics disabled
-            error_code = getattr(e, 'error_code', e.__class__.__name__)
+            error_code = getattr(e, "error_code", e.__class__.__name__)
            logger.exception(
                "Streaming chat completion failed for provider %s (model=%s, error=%s)",
                provider_name,
@@ -233,46 +261,46 @@ class LLMService:
                error_code,
            )
            raise
-    
+
    async def create_embedding(self, request: EmbeddingRequest) -> EmbeddingResponse:
        """Create embeddings with security and resilience"""
        if not self._initialized:
            await self.initialize()
-        
+
        # Security validation disabled - always allow embedding requests
        risk_score = 0.0

-        
        # Get provider
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)
-        
+
        if not provider:
-            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)
-        
+            raise ProviderError(
+                f"No available provider for model '{request.model}'",
+                provider=provider_name,
+            )
+
        # Execute with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)
        start_time = time.time()
-        
+
        try:
            response = await resilience_manager.execute(
                provider.create_embedding,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
-                non_retryable_exceptions=(ValidationError,)
+                non_retryable_exceptions=(ValidationError,),
            )
-            
-            
+
            # Record successful request - metrics disabled
            total_latency = (time.time() - start_time) * 1000

-            
            return response
-        
+
        except Exception as e:
            # Record failed request - metrics disabled
            total_latency = (time.time() - start_time) * 1000
-            error_code = getattr(e, 'error_code', e.__class__.__name__)            
+            error_code = getattr(e, "error_code", e.__class__.__name__)
            logger.exception(
                "Embedding request failed for provider %s (model=%s, latency=%.2fms, error=%s)",
                provider_name,
@@ -281,14 +309,14 @@ class LLMService:
                error_code,
            )
            raise
-    
+
    async def get_models(self, provider_name: Optional[str] = None) -> List[ModelInfo]:
        """Get available models from all or specific provider"""
        if not self._initialized:
            await self.initialize()
-        
+
        models = []
-        
+
        if provider_name:
            # Get models from specific provider
            provider = self._providers.get(provider_name)
@@ -306,16 +334,16 @@ class LLMService:
                    models.extend(provider_models)
                except Exception as e:
                    logger.error(f"Failed to get models from {name}: {e}")
-        
+
        return models
-    
+
    async def get_provider_status(self) -> Dict[str, ProviderStatus]:
        """Get health status of all providers"""
        if not self._initialized:
            await self.initialize()
-        
+
        status_dict = {}
-        
+
        for name, provider in self._providers.items():
            try:
                status = await provider.health_check()
@@ -327,21 +355,18 @@ class LLMService:
                    status="unavailable",
                    last_check=datetime.utcnow(),
                    error_message=str(e),
-                    models_available=[]
+                    models_available=[],
                )
-        
+
        return status_dict
-    
+
    def get_metrics(self) -> LLMMetrics:
        """Get service metrics - metrics disabled"""
        # return metrics_collector.get_metrics()
        return LLMMetrics(
-            total_requests=0,
-            success_rate=0.0,
-            avg_latency_ms=0,
-            error_rates={}
+            total_requests=0, success_rate=0.0, avg_latency_ms=0, error_rates={}
        )
-    
+
    def get_health_summary(self) -> Dict[str, Any]:
        """Get comprehensive health summary - metrics disabled"""
        # metrics_health = metrics_collector.get_health_summary()
@@ -349,40 +374,42 @@ class LLMService:

        return {
            "service_status": "healthy" if self._initialized else "initializing",
-            "startup_time": self._startup_time.isoformat() if self._startup_time else None,
+            "startup_time": self._startup_time.isoformat()
+            if self._startup_time
+            else None,
            "provider_count": len(self._providers),
            "active_providers": list(self._providers.keys()),
            "metrics": {"status": "disabled"},
-            "resilience": resilience_health
+            "resilience": resilience_health,
        }
-    
+
    def _get_provider_for_model(self, model: str) -> str:
        """Get provider name for a model"""
        # Check model routing first
        provider_name = config_manager.get_provider_for_model(model)
        if provider_name and provider_name in self._providers:
            return provider_name
-        
+
        # Fall back to providers that support the model
        for name, provider in self._providers.items():
            if provider.supports_model(model):
                return name
-        
+
        # Use default provider as last resort
        config = config_manager.get_config()
        if config.default_provider in self._providers:
            return config.default_provider
-        
+
        # If nothing else works, use first available provider
        if self._providers:
            return list(self._providers.keys())[0]
-        
+
        raise ProviderError(f"No provider found for model '{model}'", provider="none")
-    
+
    async def cleanup(self):
        """Cleanup service resources"""
        logger.info("Cleaning up LLM service")
-        
+
        # Cleanup providers
        for name, provider in self._providers.items():
            try:
@@ -390,7 +417,7 @@ class LLMService:
                logger.debug(f"Cleaned up provider: {name}")
            except Exception as e:
                logger.error(f"Error cleaning up provider {name}: {e}")
-        
+
        self._providers.clear()
        self._initialized = False
        logger.info("LLM service cleanup completed")