1. Chatbot con inteligencia artifical en tensorflow
- Hola a todos.En esta ocasión comenzamos un tutorial para crear y entrenar nuestro propio chatbot que se comportará con inteligencia artificial. Para crear un chatbot, o realmente hacer cualquier tipo de tarea de aprendizaje automático, el primer trabajo que tenemos que hacer es adquirir datos para el entrenamiento.Después necesitamos estructurarlos y prepararlos para que se formateen para "la entrada" y "la salida"para que un algoritmo de aprendizaje automático puede digerir.
- En esta ocasión utilizamos como fuente de datos los comentarios del conocido foro de habla inglesa reddit que dejo en este enlace torrent: magnet:?xt=urn:btih:7690f71ea949b868080401c749e878f98de34d3d&dn=reddit_data&tr=http%3A%2F%2Ftracker.pushshift.io%3A6969%2Fannounce&tr=udp%3A%2F%2Ftracker.openbittorrent.com%3A80
- La estructura de Reddit es en forma de árbol. Para un chatbot, esto significa que necesitamos separar las cosas para ser un comentario y luego una respuesta. El comentario es la entrada y la respuesta es la salida deseada. En Reddit, no todos los comentarios tienen respuestas, y puede ser que muchos comentarios tengan varias respuestas.Nos basaremos en las puntuaciones de los comentarios para elegir la mejor respuesta para nuestro chatbot. El comentario es la entrada, la respuesta es la salida deseada.
- Lo que haremos es insertar los datos de los comentarios en una base de datos. Todos los comentarios vendrán cronológicamente, por lo que todos los comentarios serán inicialmente el "padre" y no tendrán un padre propio. Sin embargo, con el tiempo, habrá respuestas, y después podremos almacenar esta "respuesta"asociada a un padre en la base de datos.
- En el siguiente vídeo explico estas ideas:
.
- Ejemplo de un json de los comentarios:
{
"author":"Arve",
"link_id":"t3_5yba3",
"score":0,
"body":"Can we please deprecate the word \"Ajax\" now? \r\n\r\n(But yeah, this _is_ much nicer)",
"score_hidden":false,
"author_flair_text":null,
"gilded":0,
"subreddit":"reddit.com",
"edited":false,
"author_flair_css_class":null,
"retrieved_on":1427426409,
"name":"t1_c0299ap",
"created_utc":"1192450643",
"parent_id":"t1_c02999p",
"controversiality":0,
"ups":0,
"distinguished":null,
"id":"c0299ap",
"subreddit_id":"t5_6",
"downs":0,
"archived":true
}
No hay comentarios:
Publicar un comentario