Benchmark trapelati: Meta Llama 3.1 potrebbe superare GPT-4o di OpenAI benchmark IA GPT-4o Instruct models Intelligenza Artificiale Llama 3.1 405B Meta Llama MMLU modelli di linguaggio Open Source OpenAI GPT-4 winograd +