html simple dom Hosting Drupal

HTML simple DOM Parser es una de las mejores cosas que me han pasado. Recuerdo los días en que yo solía usar expresiones regulares y la función preg_match_all a buscar valores de texto raspado, que no eran tan buenos. Pero desde que me encontré con este código HTML DOM analizador, la vida ha sido demasiado fácil cuando se trata de ir a buscar los datos y extraer los valores de las páginas html.

Durante mis días iniciales durante el uso de este script, que estaba confundido un buen montón de veces. El analizador es realmente tan impresionante que ofrece demasiadas características y se puede hacer casi todo lo que desea un analizador hacer. El único problema es que recordar la sintaxis y el método de llamar varias funciones, junto con numerosos parámetros distintos para cada uno de ellos.

hospedaje

He hecho una lista de códigos, que utilizo de vez en cuando, que pueden ser muy útiles para todos ustedes. Leer más para entender el uso de simple HTML DOM analizador y obtener códigos PHP ya establecido para el mismo.

Descargar y almacenar datos estructurados

Los datos pueden ser obtenidos a partir principalmente de tres fuentes diferentes. URL del archivo estático o cadena HTML. Utilice el siguiente código para crear un DOM de tres alternativas diferentes.

Encontrar elementos HTML basado en sus nombres de las etiquetas

Suponga que desea encontrar todos y cada imagen en una página web o decir, todos y cada hipervínculo. Nosotros vamos a usar la función “buscar” para extraer esta información del objeto. He aquí cómo hacerlo utilizando simple DOM HTML Analizador:

La extracción de valores de atributos a partir de elementos

Suponga que desea obtener los nombres de todos los campos de entrada en una página web, digamos por ejemplo, nimishprabhu.com/chrome-extension-hello-world-example.html. Ahora si usted ve la página web que se dará cuenta de que hay un formulario de comentarios en la página que tiene campos de entrada. Tenga en cuenta que el cuadro de comentario es un elemento de área de texto y no elemento de entrada, por lo que no será detectado. Pero para detectar resto de los campos también ha ocultas visibles que puede utilizar el código siguiente:

Elementos de filtración basado en los valores de sus atributos

Cuando un desarrollador diseña una página, utiliza varios atributos para identificar de forma única y clasificar la información en la página web. Un analizador no es humano y por lo tanto no se puede visualizar la diferencia, pero se puede detectar estos atributos y filtrar la salida a fin de obtener un conjunto preciso de datos. Tomemos un ejemplo práctico para una mejor comprensión. Si usted ve esta página. https://www.phpbb.com/community/viewtopic.php?f=46t=543171 se puede ver la página se divide en cabecera, contenido y pie de página. Ahora, incluso el contenido es subdividen en puestos. Esta página tiene sólo 1 puesto, pero me decidí a elegir este, ya que contiene mucho de hipervínculos. Ahora suponga que desea extraer sólo los hipervínculos en el puesto y no toda la página. El enfoque debe ser el siguiente:

Simple HTML DOM drupal alojamiento sólo los enlaces

Compruebe la fuente de la página web. Averiguar si los hipervínculos están siguiendo algún tipo de patrón. Si se mira de cerca se dará cuenta de que todos ellos tienen class =”postlink”. Esto hará que sean, la extracción de un pedazo de la torta. Leer el código de abajo para ver cómo filtrar los elementos HTML en base a los valores de los atributos.

Hay algo digno de mención aquí, puede utilizar “” y prefijos “#” para filtrar clase y atributos ID, respectivamente. Así que el código anterior funcionará sin ningún cambio si se utiliza el filtro como:

La coincidencia de patrones, mientras que el filtrado de atributos de los elementos

Considere el ejemplo de arriba, donde estamos extrayendo todos los enlaces de la entrada. Digamos que quiere encontrar sólo los enlaces de los sub-foros en la comunidad. Si nota que todos ellos empezar www.phpbb.com/community/viewforum.php. Así que vamos a filtrar los hipervínculos usando “comienza con” filtro a buscar sólo los enlaces que comienzan con www.phpbb.com/community/viewforum.php

Del mismo modo, digamos que si usted quiere encontrar todos los enlaces que contienen phpbb.com continuación, puede filtrar usando filtro “contiene” de la siguiente manera:

Si no está seguro acerca de sólo la parte final del valor de un atributo. Digamos, por ejemplo, usted está desguace una página web que contiene numerosos elementos div. Estos elementos div tienen el atributo id algo como:

contenidos aquí

contenidos aquí

y así.
A continuación, puede encontrar muchas elementos div utilizando el “termina con” filtro de la siguiente manera:

Adición / modificación de atributos de los elementos

Digamos que usted quiere cambiar el valor del atributo del elemento en particular. Por ejemplo, si hubiese deseado cambiar todos los hipervínculos tener class = postlink a class = topiclink, puede hacerlo de la siguiente manera:

Encontrar enésimo elemento de datos analizada

Tenga en cuenta que la numeración de elementos comienza desde 0 y no por 1. Así, el primer elemento se encuentra en la posición 0 ª. Supongamos que se desea extraer el hipervínculo de la tercera clase de vínculo con postlink en una página web, puede utilizar el siguiente enfoque:

La manipulación del contenido interno de etiquetas

Si desea borrar el contenido interno de la div con id como contenido, puede hacerlo de la siguiente manera:

Si desea añadir texto al contenido existente, puede hacerlo de la siguiente manera:

Finde para anteponer texto para el contenido existente, puede utilizar el siguiente código:

Envolver el contenido de un elemento dentro de un nuevo elemento

Digamos que tiene un div existente con la identificación de contenido, ahora se hizo un div contenedor y quieren encerrar el div contenido en el div contenedor. He aquí cómo se hace:

Manejo de problemas de pérdida de memoria durante el uso de Simple PHP HTML DOM analizador

Por último, pero no menos importante, el manejo del problema de pérdida de memoria. Una vez que empiece a usar este script ampliamente se producirán errores de memoria agotado y seguiremos preguntando qué le pasa a la secuencia de comandos. El problema puede deberse a no manejar el problema de pérdida de memoria. No voy a hablar en detalle acerca de lo que es pérdida de memoria o cómo se produce este problema, pero se puede leer un poco sobre ello aquí .Para tratar esta cuestión no se olvide de borrar la variable $ html creado y desarmar una vez que no se requiere promover.

También puede utilizar la función fresco creado por Flash trueno de StackOverFlow.com, comprobar que funciona aquí, junto con su ejemplo de uso.

Creo que estos ejemplos son suficientes para que usted pueda empezar a utilizar PHP simple HTML DOM analizador. Si tiene alguna duda o consulta utiliza el formulario de comentarios a continuación. Voy a añadir más ejemplos según las peticiones y consultas. Espero que este artículo le ayuda a raspar datos de forma eficiente.

Esta entrada fue publicada en PHP.

4 pensamientos en “ Los 10 Ejemplos de uso de Simple PHP HTML DOM analizador ”

Hola. compruebe html

100 Balas (lectores maduros) # 100 cerca de la menta MAXIMUM_ORDER_TEXT [46373]
$ 4.99

A partir de esto, quiero desechar único título es decir “100 Balas (lectores maduros) # 100 cerca de la menta”
Pero estoy recibiendo tanto Aquí está el O / P
[PRODUCT_TITLE] => Array
(
[0] => 100 Balas (lectores maduros) # 30 cerca de la menta
[10]
MAXIMUM_ORDER_TEXT
[1] => $ 1.99
[2] => 100 Balas (lectores maduros) # 100 cerca de la menta
[46373]
MAXIMUM_ORDER_TEXT
[3] => $ 4.99
[4] => 100 Balas (lectores maduros) # 32 cerca de la menta
[12]
MAXIMUM_ORDER_TEXT
[5] => $ 1.99
[6] => 100 Balas (lectores maduros) # 34 cerca de la menta
[14]
MAXIMUM_ORDER_TEXT
[7] => $ 1.99
[8] => 100 aniversario Guardianes especial del Galaxy (2014 solo disparo) # 1 (variante) cerca de la menta

Por favor dejame saber que hacer.

Observar el patrón y por lo tanto dividir las cuerdas obtenidos.

$ Title = explode ( ‘[‘, $ PRODUCT_TITLE);
o
$ Title = explode ( ‘cerca de la menta’, $ PRODUCT_TITLE);

A continuación, utilice [0] $ título para obtener el resultado final.

Confiar en esta ayuda.

Gracias Saludos

¡Mira este video!

Artículos relacionados

Geolitecity dat Hosting DrupalEstoy tratando de añadir Geo IP a un sitio im trabajando en; he utilizado módulos IP y Geo IP contexto geo y soy capaz de crear un contexto basado en un país. Sin embargo tengo que mostrar contenido basado en ...
¿Por qué utilizar wordpress sobre alojamiento DrupalPublicado por Tom Ewer el 6 de agosto, 2015 si estás en el punto donde desea iniciar un blog, ya sea por motivos profesionales o personales, su mejor opción es un sitio web alojado en sí mismo ...
Neerav mehta Hosting DrupalDos semanas atrás, yo estaba más en eBay cuando uno de los gerentes de producto que trabajamos intervino "Voy a ser muy triste si 3 años a partir de ahora, usted todavía está atascado en Drupal." Como empresa, tenemos ...
galería simple módulo de alojamiento DrupalEste módulo proporciona una integración entre la popular biblioteca galería sensible Juicebox HTML5 y Drupal. Juicebox es en muchos aspectos el sucesor del espectador común y ofrece una potente ...
Drupal hosting con SSLHTTPS es un protocolo que cifra las peticiones HTTP y sus respuestas. Esto asegura que si alguien fuera capaz de poner en peligro la red entre el ordenador y el servidor que solicita ...