Solución de problemas
El sistema no puede encontrar las bibliotecas CUDA
A veces, el conjunto de herramientas CUDA se instala en una ubicación no estándar. El mensaje de error aquí es a menudo no es capaz de encontrar libcu*12
. Por ejemplo, puede que tengas CUDA instalado con tu configuración de Python. El siguiente comando instalaría CUDA en el entorno de Python.
sudo apt install python3-pip -y
pip3 install --upgrade fschat accelerate autoawq vllm
La forma más fácil de solucionarlo es simplemente enlazar esas librerías CUDA no estándar a la ubicación estándar, de esta forma.
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12
Fallo en la recuperación de la instantánea de recogida en Windows WSL
En Windows WSL, puede aparecer este error mientras se ejecuta gaianet init
.
* Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}
Cuando se mira en el ~/gaianet/log/init-qdrant.log
podría aparecer esta línea de error
2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }
La solución es desactivar el autoMemoryReclaim
en WSL. Paso para activar/desactivar esta función:
- Editar
C:\Users<Your user name>.wslconfig
- Eliminar o comentar
autoMemoryReclaim
en[experimental]
sección.
Gracias a RoggeOhta por descubrirlo. Puede obtener más información aquí.
No se ha podido iniciar el nodo con un mensaje de error El puerto 8080 está en uso. Salir ...
Es posible que aparezca el siguiente error al ejecutar inicio de gaianet
.
gaianet start
[+] Comprobando el archivo config.json ...
Ya tiene una clave privada.
[+] Iniciando el servidor API de LlamaEdge ...
El puerto 8080 está en uso. Salir ...
La solución es ejecutar parada de gaianet
primero para matar todos los procesos, y luego ejecute inicio de gaianet
para iniciar el nodo.
Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory
En Windows WSL, puede aparecer este error al ejecutar curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash
* Generar nodo IS
[2024-07-02 17:50:55.175] [error] carga fallida: ruta no válida, Código: 0x20
[2024-07-02 17:50:55.175] [error] Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory
[2024-07-02 17:50:55.176] [error] Error de carga: ruta no válida, Código: 0x20
[2024-07-02 17:50:55.176] [error] Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory
El error se debe a la falta de libgomp.so.1
una biblioteca que debería instalarse automáticamente por defecto en Ubuntu.
Para solucionarlo, debe instalar el libgomp.so.1
biblioteca.
sudo apt-get update
sudo apt-get install libgomp1
Si utiliza CentOS, puede utilizar
yum install libgomp
Este problema se solucionó en versión 0.2.2
.
Error al eliminar la colección por defecto
Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}
Típicamente indica que la instancia Qdrant no fue apagada correctamente antes de intentar initarse de nuevo con una nueva instantánea. La solución es detener primero el nodo GaiaNet.
parada de gaianet
Alternativamente, puedes matar manualmente los procesos desde el terminal o en el Monitor de Actividad del Sistema Operativo.
sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc
A continuación, puede ejecutar gaianet init
y luego inicio de gaianet
otra vez.
Error de E/S de archivo
* Importar la instantánea de la colección Qdrant ...
El proceso puede tardar unos minutos. Por favor, espere ...
* Error] No se ha podido recuperar la instantánea de la colección. Se ha producido un error al procesar el campo `snapshot`: Error de E/S de archivo: Operación no permitida (error os 1)
Típicamente indica que la instancia Qdrant no fue apagada correctamente antes de intentar initarse de nuevo con una nueva instantánea. La solución es detener primero el nodo GaiaNet.
parada de gaianet
Alternativamente, puedes matar manualmente los procesos desde el terminal o en el Monitor de Actividad del Sistema Operativo.
sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc
A continuación, puede ejecutar gaianet init
y luego inicio de gaianet
otra vez.
Error "No se pudo abrir el archivo
Advertencia: Error al abrir el archivo
Advertencia: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Advertencia: /main/consensus/consensus.snapshot: No such file or directory
curl: (23) Fallo al escribir la salida en el destino
La razón de este tipo de error es una configuración incorrecta config.json
archivo. La solución es eliminar los comentarios en config.json
y vuelva a ejecutar el gaianet init
mando.
Error "Demasiados archivos abiertos" en macOS
En funcionamiento gaianet init
para inicializar un nuevo nodo en macOS, es posible que se produzca un error relacionado con la recuperación de instantáneas si la instantánea contiene una gran cantidad de texto. El mensaje de error puede ser el siguiente:
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
Este problema está causado por el límite predeterminado del descriptor de archivos (FD) en macOS, que está establecido en un valor relativamente bajo de 256.
Para resolver este problema, puede aumentar el límite de FD por defecto en su sistema. Para ello, ejecute el siguiente comando:
ulimit -n 10000
Esto fijará temporalmente el límite de FD en 10.000. A continuación, utilice gaianet init
y inicio de gaianet
comandos en el MISMO terminal.
Permiso denegado al utilizar el script de instalación para instalar WasmEdge
En funcionamiento curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash
para instalar el software del nodo GaiaNet, puede encontrarse con el error de permiso denegado especialmente al instalar el tiempo de ejecución WasmEdge.
Este error se debe a la falta de /tmp
permiso de escritura. Puede utilizar --tmpdir
para especificar dónde desea instalar el tiempo de ejecución WasmEdge. Tenga en cuenta que tendrá que tener permiso por escrito a la <YOUR_PATH>
carpeta.
curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir YOUR_PATH
Este problema se soluciona en versión 0.2.3
.