Resumen - Desventajas computacionales-statísticas de la NP-hardiedad

Título
Desventajas computacionales-statísticas de la NP-hardiedad

Tiempo
2025-07-17 15:35:36

Autor
{"Guy Blanc","Caleb Koch","Carmen Strassle","Li-Yang Tan"}

Categoría
{cs.CC,cs.DS,cs.LG}

Enlace
http://arxiv.org/abs/2507.13222v1

PDF Enlace
http://arxiv.org/pdf/2507.13222v1

Resumen

Este artículo explora la relación entre la complejidad de tiempo de ejecución y la complejidad de muestra en algoritmos de aprendizaje, específicamente en el contexto de la NP-dureza. Demostró que existe un intercambio entre estos dos recursos, lo que significa que mejorar uno a menudo conlleva un coste en el otro. Los autores se centran en el modelo de aprendizaje PAC, donde el objetivo es aprender una clase de conceptos con un número pequeño de muestras. Muestran que para cada función de complejidad de tiempo polinómico p(n), existe una clase de conceptos C con dimensión VC 1 que requiere Θ(p(n)) de muestras para aprenderse de manera eficiente. El artículo también establece una conexión entre la dificultad de aprendizaje y la dificultad de NP. Específicamente, prueba que si RP = NP (es decir, cada lenguaje en NP puede ser decidido en tiempo polinómico con un algoritmo aleatorio), entonces cada clase enumerable de NP puede aprenderse en tiempo polinómico con O(dimVC(C)) de muestras. Por el contrario, si RP ≠ NP, entonces existe una clase enumerable de NP que no puede aprenderse en tiempo polinómico con Φ(dimVC(C)) de muestras para cualquier función Φ. Los autores alcanzan estos resultados definiendo un problema de aprendizaje basado en el problema SAT y mostrando que sus intercambios de tiempo versus complejidad de muestra heredan aquellos del SAT. También demuestran que sus técnicas pueden extenderse a otros entornos, como el aprendizaje con distribución uniforme y el aprendizaje en línea. El artículo realiza varias contribuciones importantes: 1. Proporciona los primeros límites inferiores basados en NP-dureza para el aprendizaje, superando las barreras anteriores. 2. Establece una conexión entre la dificultad de aprendizaje y la dificultad de NP. 3. Extiende el concepto de intercambios computacionales-statísticos a otros entornos de aprendizaje. En resumen, este artículo contribuye significativamente a nuestra comprensión de las limitaciones de los algoritmos de aprendizaje y la interacción entre la complejidad de tiempo de ejecución y la complejidad de muestra.


Artículos Recomendados

Dinámica de solo spin en el modelo no recíproco de Dicke de múltiples especies

Escala jerárquica de Whitham de género cero mediante manifolds de Hurwitz--Frobenius

Una nueva prueba de teoremas de tipo Liouville para una clase de ecuaciones elípticas semilineales

Teorema de Fagin para Máquinas de Turing de Semirrecta

Teoría de Hida superior para las curvas modulares de Drinfeld

Predicción de retro-síntesis impulsada por la lógica con modelos de lenguaje grandes a través del aprendizaje por refuerzo

Simulando múltiples perspectivas humanas en sistemas socioecológicos utilizando modelos de gran lenguaje

Planetas más grandes que Neptuno tienen elevadas excentricidades

Diseño computacional de medicamentos personalizados mediante optimización robusta bajo incertidumbre

Un estudio de caso de GW190425 para la clasificación de colisiones de estrellas de neutrones binarias versus colisiones de agujeros negros binarios y la limitación de materia oscura asimétrica con detectores de ondas gravitacionales