Ir al contenido principal
Versión: 2.0.0

Solución de problemas

El sistema no puede encontrar las bibliotecas CUDA

A veces, el conjunto de herramientas CUDA se instala en una ubicación no estándar. El mensaje de error aquí es a menudo no es capaz de encontrar libcu*12. Por ejemplo, puede que tengas CUDA instalado con tu configuración de Python. El siguiente comando instalaría CUDA en el entorno de Python.

sudo apt install python3-pip -y
pip3 install --upgrade fschat accelerate autoawq vllm

La forma más fácil de solucionarlo es simplemente enlazar esas librerías CUDA no estándar a la ubicación estándar, de esta forma.

ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublas.so.12 /usr/lib/libcublas.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cuda_runtime/lib/libcudart.so.12 /usr/lib/libcudart.so.12
ln -s /usr/local/lib/python3.10/dist-packages/nvidia/cublas/lib/libcublasLt.so.12 /usr/lib/libcublasLt.so.12

Fallo en la recuperación de la instantánea de recogida en Windows WSL

En Windows WSL, puede aparecer este error mientras se ejecuta gaianet init.

   * Import the Qdrant collection snapshot ...
The process may take a few minutes. Please wait ...
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Tokio task join error: task 1242 panicked"},"time":0.697784244}

Cuando se mira en el ~/gaianet/log/init-qdrant.log podría aparecer esta línea de error

2024-05-20T07:24:52.900895Z ERROR qdrant::startup: Panic occurred in file /home/runner/.cargo/registry/src/index.crates.io-6f17d22bba15001f/cgroups-rs-0.3.4/src/memory.rs at line 587: called `Result::unwrap()` on an `Err` value: Error { kind: ReadFailed("/sys/fs/cgroup/memory.high"), cause: Some(Os { code: 2, kind: NotFound, message: "No such file or directory" }) }  

La solución es desactivar el autoMemoryReclaim en WSL. Paso para activar/desactivar esta función:

  1. Editar C:\Users<Your user name>.wslconfig
  2. Eliminar o comentar autoMemoryReclaim en [experimental] sección.

Gracias a RoggeOhta por descubrirlo. Puede obtener más información aquí.

No se ha podido iniciar el nodo con un mensaje de error El puerto 8080 está en uso. Salir ...

Es posible que aparezca el siguiente error al ejecutar inicio de gaianet.

gaianet start
[+] Comprobando el archivo config.json ...

Ya tiene una clave privada.
[+] Iniciando el servidor API de LlamaEdge ...

El puerto 8080 está en uso. Salir ...

La solución es ejecutar parada de gaianet primero para matar todos los procesos, y luego ejecute inicio de gaianet para iniciar el nodo.

Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory

En Windows WSL, puede aparecer este error al ejecutar curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash

* Generar nodo IS
[2024-07-02 17:50:55.175] [error] carga fallida: ruta no válida, Código: 0x20
[2024-07-02 17:50:55.175] [error] Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory
[2024-07-02 17:50:55.176] [error] Error de carga: ruta no válida, Código: 0x20
[2024-07-02 17:50:55.176] [error] Error al cargar la biblioteca: libgomp.so.1: no se puede abrir el archivo de objetos compartidos: No such file or directory

El error se debe a la falta de libgomp.so.1una biblioteca que debería instalarse automáticamente por defecto en Ubuntu.

Para solucionarlo, debe instalar el libgomp.so.1 biblioteca.

sudo apt-get update
sudo apt-get install libgomp1

Si utiliza CentOS, puede utilizar

yum install libgomp

Este problema se solucionó en versión 0.2.2.

Error al eliminar la colección por defecto

Failed to remove the default collection. {"status":{"error":"Service internal error: No such file or directory (os error 2)"},"time":0.050924542}

Típicamente indica que la instancia Qdrant no fue apagada correctamente antes de intentar initarse de nuevo con una nueva instantánea. La solución es detener primero el nodo GaiaNet.

parada de gaianet

Alternativamente, puedes matar manualmente los procesos desde el terminal o en el Monitor de Actividad del Sistema Operativo.

sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc

A continuación, puede ejecutar gaianet init y luego inicio de gaianet otra vez.

Error de E/S de archivo

    * Importar la instantánea de la colección Qdrant ...
El proceso puede tardar unos minutos. Por favor, espere ...
* Error] No se ha podido recuperar la instantánea de la colección. Se ha producido un error al procesar el campo `snapshot`: Error de E/S de archivo: Operación no permitida (error os 1)

Típicamente indica que la instancia Qdrant no fue apagada correctamente antes de intentar initarse de nuevo con una nueva instantánea. La solución es detener primero el nodo GaiaNet.

parada de gaianet

Alternativamente, puedes matar manualmente los procesos desde el terminal o en el Monitor de Actividad del Sistema Operativo.

sudo pkill -9 qdrant
sudo pkill -9 wasmedge
sudo pkill -9 frpc

A continuación, puede ejecutar gaianet init y luego inicio de gaianet otra vez.

Error "No se pudo abrir el archivo

Advertencia: Error al abrir el archivo 
Advertencia: https://huggingface.co/datasets/max-id/gaianet-qdrant-snapshot/resolve
Advertencia: /main/consensus/consensus.snapshot: No such file or directory
curl: (23) Fallo al escribir la salida en el destino

La razón de este tipo de error es una configuración incorrecta config.json archivo. La solución es eliminar los comentarios en config.json y vuelva a ejecutar el gaianet init mando.

Error "Demasiados archivos abiertos" en macOS

En funcionamiento gaianet init para inicializar un nuevo nodo en macOS, es posible que se produzca un error relacionado con la recuperación de instantáneas si la instantánea contiene una gran cantidad de texto. El mensaje de error puede ser el siguiente:

 * [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}
* [Error] Failed to recover from the collection snapshot. {"status":{"error":"Service internal error: Too many open files (os error 24)"},"time":1.574064833}

Este problema está causado por el límite predeterminado del descriptor de archivos (FD) en macOS, que está establecido en un valor relativamente bajo de 256.

Para resolver este problema, puede aumentar el límite de FD por defecto en su sistema. Para ello, ejecute el siguiente comando:

ulimit -n 10000

Esto fijará temporalmente el límite de FD en 10.000. A continuación, utilice gaianet init y inicio de gaianet comandos en el MISMO terminal.

Permiso denegado al utilizar el script de instalación para instalar WasmEdge

En funcionamiento curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash para instalar el software del nodo GaiaNet, puede encontrarse con el error de permiso denegado especialmente al instalar el tiempo de ejecución WasmEdge.

Este error se debe a la falta de /tmp permiso de escritura. Puede utilizar --tmpdir para especificar dónde desea instalar el tiempo de ejecución WasmEdge. Tenga en cuenta que tendrá que tener permiso por escrito a la <YOUR_PATH> carpeta.

curl -sSfL 'https://github.com/GaiaNet-AI/gaianet-node/releases/latest/download/install.sh' | bash -s -- --tmpdir YOUR_PATH

Este problema se soluciona en versión 0.2.3.