enclava/backend/app/services/llm/service.py

"""
LLM Service

Main service that coordinates providers, security, resilience, and metrics.
Replaces LiteLLM client functionality with direct provider integration.
"""

import asyncio
import logging
import time
from typing import Dict, Any, Optional, List, AsyncGenerator
from datetime import datetime

from .models import (
    ChatRequest, ChatResponse, EmbeddingRequest, EmbeddingResponse,
    ModelInfo, ProviderStatus, LLMMetrics
)
from .config import config_manager, ProviderConfig
from ...core.config import settings
from .security import security_manager
from .resilience import ResilienceManagerFactory
from .metrics import metrics_collector
from .providers import BaseLLMProvider, PrivateModeProvider
from .exceptions import (
    LLMError, ProviderError, SecurityError, ConfigurationError,
    ValidationError, TimeoutError
)

logger = logging.getLogger(__name__)


class LLMService:
    """Main LLM service coordinating all components"""

    def __init__(self):
        """Initialize LLM service"""
        self._providers: Dict[str, BaseLLMProvider] = {}
        self._initialized = False
        self._startup_time: Optional[datetime] = None

        logger.info("LLM Service initialized")

    async def initialize(self):
        """Initialize service and providers"""
        if self._initialized:
            logger.warning("LLM Service already initialized")
            return

        start_time = time.time()
        self._startup_time = datetime.utcnow()

        try:
            # Get configuration
            config = config_manager.get_config()
            logger.info(f"Initializing LLM service with {len(config.providers)} configured providers")

            # Initialize enabled providers
            enabled_providers = config_manager.get_enabled_providers()
            if not enabled_providers:
                raise ConfigurationError("No enabled providers found")

            for provider_name in enabled_providers:
                await self._initialize_provider(provider_name)

            # Verify we have at least one working provider
            if not self._providers:
                raise ConfigurationError("No providers successfully initialized")

            # Verify default provider is available
            default_provider = config.default_provider
            if default_provider not in self._providers:
                available_providers = list(self._providers.keys())
                logger.warning(f"Default provider '{default_provider}' not available, using '{available_providers[0]}'")
                config.default_provider = available_providers[0]

            self._initialized = True
            initialization_time = (time.time() - start_time) * 1000

            logger.info(f"LLM Service initialized successfully in {initialization_time:.2f}ms")
            logger.info(f"Available providers: {list(self._providers.keys())}")

        except Exception as e:
            logger.error(f"Failed to initialize LLM service: {e}")
            raise ConfigurationError(f"LLM service initialization failed: {e}")

    async def _initialize_provider(self, provider_name: str):
        """Initialize a specific provider"""
        try:
            provider_config = config_manager.get_provider_config(provider_name)
            if not provider_config or not provider_config.enabled:
                logger.warning(f"Provider '{provider_name}' not enabled, skipping")
                return

            # Get API key
            api_key = config_manager.get_api_key(provider_name)
            if not api_key:
                logger.error(f"No API key found for provider '{provider_name}'")
                return

            # Create provider instance
            provider = self._create_provider(provider_config, api_key)

            # Initialize provider
            await provider.initialize()

            # Test provider health
            health_status = await provider.health_check()
            if health_status.status == "unavailable":
                logger.error(f"Provider '{provider_name}' failed health check: {health_status.error_message}")
                return

            # Register provider
            self._providers[provider_name] = provider
            logger.info(f"Provider '{provider_name}' initialized successfully (status: {health_status.status})")

            # Fetch and update models dynamically
            await self._refresh_provider_models(provider_name, provider)

        except Exception as e:
            logger.error(f"Failed to initialize provider '{provider_name}': {e}")

    def _create_provider(self, config: ProviderConfig, api_key: str) -> BaseLLMProvider:
        """Create provider instance based on configuration"""
        if config.name == "privatemode":
            return PrivateModeProvider(config, api_key)
        else:
            raise ConfigurationError(f"Unknown provider type: {config.name}")

    async def _refresh_provider_models(self, provider_name: str, provider: BaseLLMProvider):
        """Fetch and update models dynamically from provider"""
        try:
            # Get models from provider
            models = await provider.get_models()
            model_ids = [model.id for model in models]

            # Update configuration
            await config_manager.refresh_provider_models(provider_name, model_ids)

            logger.info(f"Refreshed {len(model_ids)} models for provider '{provider_name}': {model_ids}")

        except Exception as e:
            logger.error(f"Failed to refresh models for provider '{provider_name}': {e}")

    async def create_chat_completion(self, request: ChatRequest) -> ChatResponse:
        """Create chat completion with security and resilience"""
        if not self._initialized:
            await self.initialize()

        # Validate request
        if not request.messages:
            raise ValidationError("Messages cannot be empty", field="messages")

        # Security validation (only if enabled)
        messages_dict = [{"role": msg.role, "content": msg.content} for msg in request.messages]

        if settings.API_SECURITY_ENABLED:
            is_safe, risk_score, detected_patterns = security_manager.validate_prompt_security(messages_dict)
        else:
            # Security disabled - always safe
            is_safe, risk_score, detected_patterns = True, 0.0, []

        if not is_safe:
            # Log security violation
            security_manager.create_audit_log(
                user_id=request.user_id,
                api_key_id=request.api_key_id,
                provider="blocked",
                model=request.model,
                request_type="chat_completion",
                risk_score=risk_score,
                detected_patterns=[p.get("pattern", "") for p in detected_patterns]
            )

            # Record blocked request
            metrics_collector.record_request(
                provider="security",
                model=request.model,
                request_type="chat_completion",
                success=False,
                latency_ms=0,
                security_risk_score=risk_score,
                error_code="SECURITY_BLOCKED",
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )

            raise SecurityError(
                "Request blocked due to security concerns",
                risk_score=risk_score,
                details={"detected_patterns": detected_patterns}
            )

        # Get provider for model
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)

        if not provider:
            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)

        # Log detailed request if enabled
        security_manager.log_detailed_request(
            messages=messages_dict,
            model=request.model,
            user_id=request.user_id,
            provider=provider_name,
            context_info={
                "temperature": request.temperature,
                "max_tokens": request.max_tokens,
                "risk_score": f"{risk_score:.3f}"
            }
        )

        # Execute with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)
        start_time = time.time()

        try:
            response = await resilience_manager.execute(
                provider.create_chat_completion,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
                non_retryable_exceptions=(SecurityError, ValidationError)
            )

            # Update response with security information
            response.security_check = is_safe
            response.risk_score = risk_score
            response.detected_patterns = [p.get("pattern", "") for p in detected_patterns]

            # Log detailed response if enabled
            if response.choices:
                content = response.choices[0].message.content
                security_manager.log_detailed_response(
                    response_content=content,
                    token_usage=response.usage.model_dump() if response.usage else None,
                    provider=provider_name
                )

            # Record successful request
            total_latency = (time.time() - start_time) * 1000
            metrics_collector.record_request(
                provider=provider_name,
                model=request.model,
                request_type="chat_completion",
                success=True,
                latency_ms=total_latency,
                token_usage=response.usage.model_dump() if response.usage else None,
                security_risk_score=risk_score,
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )

            # Create audit log
            security_manager.create_audit_log(
                user_id=request.user_id,
                api_key_id=request.api_key_id,
                provider=provider_name,
                model=request.model,
                request_type="chat_completion",
                risk_score=risk_score,
                detected_patterns=[p.get("pattern", "") for p in detected_patterns],
                metadata={
                    "success": True,
                    "latency_ms": total_latency,
                    "token_usage": response.usage.model_dump() if response.usage else None
                }
            )

            return response

        except Exception as e:
            # Record failed request
            total_latency = (time.time() - start_time) * 1000
            error_code = getattr(e, 'error_code', e.__class__.__name__)

            metrics_collector.record_request(
                provider=provider_name,
                model=request.model,
                request_type="chat_completion",
                success=False,
                latency_ms=total_latency,
                security_risk_score=risk_score,
                error_code=error_code,
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )

            # Create audit log for failure
            security_manager.create_audit_log(
                user_id=request.user_id,
                api_key_id=request.api_key_id,
                provider=provider_name,
                model=request.model,
                request_type="chat_completion",
                risk_score=risk_score,
                detected_patterns=[p.get("pattern", "") for p in detected_patterns],
                metadata={
                    "success": False,
                    "error": str(e),
                    "error_code": error_code,
                    "latency_ms": total_latency
                }
            )

            raise

    async def create_chat_completion_stream(self, request: ChatRequest) -> AsyncGenerator[Dict[str, Any], None]:
        """Create streaming chat completion"""
        if not self._initialized:
            await self.initialize()

        # Security validation (same as non-streaming)
        messages_dict = [{"role": msg.role, "content": msg.content} for msg in request.messages]

        if settings.API_SECURITY_ENABLED:
            is_safe, risk_score, detected_patterns = security_manager.validate_prompt_security(messages_dict)
        else:
            # Security disabled - always safe
            is_safe, risk_score, detected_patterns = True, 0.0, []

        if not is_safe:
            raise SecurityError(
                "Streaming request blocked due to security concerns",
                risk_score=risk_score,
                details={"detected_patterns": detected_patterns}
            )

        # Get provider
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)

        if not provider:
            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)

        # Execute streaming with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)

        try:
            async for chunk in await resilience_manager.execute(
                provider.create_chat_completion_stream,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
                non_retryable_exceptions=(SecurityError, ValidationError)
            ):
                yield chunk

        except Exception as e:
            # Record streaming failure
            error_code = getattr(e, 'error_code', e.__class__.__name__)
            metrics_collector.record_request(
                provider=provider_name,
                model=request.model,
                request_type="chat_completion_stream",
                success=False,
                latency_ms=0,
                security_risk_score=risk_score,
                error_code=error_code,
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )
            raise

    async def create_embedding(self, request: EmbeddingRequest) -> EmbeddingResponse:
        """Create embeddings with security and resilience"""
        if not self._initialized:
            await self.initialize()

        # Security validation for embedding input
        input_text = request.input if isinstance(request.input, str) else " ".join(request.input)

        if settings.API_SECURITY_ENABLED:
            is_safe, risk_score, detected_patterns = security_manager.validate_prompt_security([
                {"role": "user", "content": input_text}
            ])
        else:
            # Security disabled - always safe
            is_safe, risk_score, detected_patterns = True, 0.0, []

        if not is_safe:
            raise SecurityError(
                "Embedding request blocked due to security concerns",
                risk_score=risk_score,
                details={"detected_patterns": detected_patterns}
            )

        # Get provider
        provider_name = self._get_provider_for_model(request.model)
        provider = self._providers.get(provider_name)

        if not provider:
            raise ProviderError(f"No available provider for model '{request.model}'", provider=provider_name)

        # Execute with resilience
        resilience_manager = ResilienceManagerFactory.get_manager(provider_name)
        start_time = time.time()

        try:
            response = await resilience_manager.execute(
                provider.create_embedding,
                request,
                retryable_exceptions=(ProviderError, TimeoutError),
                non_retryable_exceptions=(SecurityError, ValidationError)
            )

            # Update response with security information
            response.security_check = is_safe
            response.risk_score = risk_score

            # Record successful request
            total_latency = (time.time() - start_time) * 1000
            metrics_collector.record_request(
                provider=provider_name,
                model=request.model,
                request_type="embedding",
                success=True,
                latency_ms=total_latency,
                token_usage=response.usage.model_dump() if response.usage else None,
                security_risk_score=risk_score,
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )

            return response

        except Exception as e:
            # Record failed request
            total_latency = (time.time() - start_time) * 1000
            error_code = getattr(e, 'error_code', e.__class__.__name__)

            metrics_collector.record_request(
                provider=provider_name,
                model=request.model,
                request_type="embedding",
                success=False,
                latency_ms=total_latency,
                security_risk_score=risk_score,
                error_code=error_code,
                user_id=request.user_id,
                api_key_id=request.api_key_id
            )

            raise

    async def get_models(self, provider_name: Optional[str] = None) -> List[ModelInfo]:
        """Get available models from all or specific provider"""
        if not self._initialized:
            await self.initialize()

        models = []

        if provider_name:
            # Get models from specific provider
            provider = self._providers.get(provider_name)
            if provider:
                try:
                    provider_models = await provider.get_models()
                    models.extend(provider_models)
                except Exception as e:
                    logger.error(f"Failed to get models from {provider_name}: {e}")
        else:
            # Get models from all providers
            for name, provider in self._providers.items():
                try:
                    provider_models = await provider.get_models()
                    models.extend(provider_models)
                except Exception as e:
                    logger.error(f"Failed to get models from {name}: {e}")

        return models

    async def get_provider_status(self) -> Dict[str, ProviderStatus]:
        """Get health status of all providers"""
        if not self._initialized:
            await self.initialize()

        status_dict = {}

        for name, provider in self._providers.items():
            try:
                status = await provider.health_check()
                status_dict[name] = status
            except Exception as e:
                logger.error(f"Health check failed for {name}: {e}")
                status_dict[name] = ProviderStatus(
                    provider=name,
                    status="unavailable",
                    last_check=datetime.utcnow(),
                    error_message=str(e),
                    models_available=[]
                )

        return status_dict

    def get_metrics(self) -> LLMMetrics:
        """Get service metrics"""
        return metrics_collector.get_metrics()

    def get_health_summary(self) -> Dict[str, Any]:
        """Get comprehensive health summary"""
        metrics_health = metrics_collector.get_health_summary()
        resilience_health = ResilienceManagerFactory.get_all_health_status()

        return {
            "service_status": "healthy" if self._initialized else "initializing",
            "startup_time": self._startup_time.isoformat() if self._startup_time else None,
            "provider_count": len(self._providers),
            "active_providers": list(self._providers.keys()),
            "metrics": metrics_health,
            "resilience": resilience_health
        }

    def _get_provider_for_model(self, model: str) -> str:
        """Get provider name for a model"""
        # Check model routing first
        provider_name = config_manager.get_provider_for_model(model)
        if provider_name and provider_name in self._providers:
            return provider_name

        # Fall back to providers that support the model
        for name, provider in self._providers.items():
            if provider.supports_model(model):
                return name

        # Use default provider as last resort
        config = config_manager.get_config()
        if config.default_provider in self._providers:
            return config.default_provider

        # If nothing else works, use first available provider
        if self._providers:
            return list(self._providers.keys())[0]

        raise ProviderError(f"No provider found for model '{model}'", provider="none")

    async def cleanup(self):
        """Cleanup service resources"""
        logger.info("Cleaning up LLM service")

        # Cleanup providers
        for name, provider in self._providers.items():
            try:
                await provider.cleanup()
                logger.debug(f"Cleaned up provider: {name}")
            except Exception as e:
                logger.error(f"Error cleaning up provider {name}: {e}")

        self._providers.clear()
        self._initialized = False
        logger.info("LLM service cleanup completed")


# Global LLM service instance
llm_service = LLMService()