imprimir texto extranjero para PHP en UBUNTU y CENTOS

imprimir texto extranjero para PHP en UBUNTU y CENTOS

Estoy usando domdocuments y cosas como $div->nodeValue para obtener cierta información de una página web.

En mi máquina Ubuntu, cuando hago php crawl.php, todo se muestra correctamente en chino (la página está en UTF-8).

Sin embargo, en mi máquina CENTOS usando el mismo código obtengo æ´å¤åå¸ cuando imprimo en la terminal. y cuando lo guardo en la base de datos, los caracteres también están desordenados.

Una cosa que noté es que cuando imprimo $content, ambos sistemas los muestran correctamente.

Respuesta1

Verifique el conjunto de caracteres y la intercalación de la conexión MySQL, mientras inserta el contenido de los datos capturados, Mysql debe saber qué conjunto de caracteres y intercalación se utilizarán para almacenar los datos. agregue las siguientes líneas a su script php. De esta manera, su código será mucho más estable para funcionar en diferentes sistemas operativos y configuraciones.

`
$dbcharset='utf8';
$dbcollation='utf8_general_ci';
mysql_query('ESTABLECER CONJUNTO DE CARACTERES '.$dbcharset);
mysql_query("ESTABLECER NOMBRES '".$dbcharset."' COLLATE '".$dbcollation."'");
`

información relacionada