Difference between revisions of "Workshop:Algolit"
(→Louise) |
Floriantao (Talk | contribs) (→Florian) |
||
Line 4: | Line 4: | ||
=== Florian === | === Florian === | ||
+ | |||
+ | Machine Learning en temps réel par principe de contamination, utilisation du principe de la chaîne de Markov. | ||
+ | |||
+ | Première étape: | ||
+ | *Créer un fichier data.txt qui va contenir tout le texte générer par les intervenants. | ||
+ | |||
+ | [SCREEN A VENIR] | ||
+ | |||
+ | * | ||
=== Brandon === | === Brandon === |
Revision as of 09:31, 30 October 2018
Contents
projets
Florian
Machine Learning en temps réel par principe de contamination, utilisation du principe de la chaîne de Markov.
Première étape:
- Créer un fichier data.txt qui va contenir tout le texte générer par les intervenants.
[SCREEN A VENIR]
Brandon
"Celui qui avale une noix de coco fait confiance en son anus"
Louise
Les textes de loi de prostitution
Travail en deux temps :
- Création d'une édition à partir du script (basé sur Markov Chain), enregistré en page html. --> Les phrases dans lesquelles reviennent le plus souvent le champ lexical de l'homme s'affichent en vert, celles dans lesquelles on retrouve le plus le champ lexical de la femme s'affichent en rouge. (ou autres couleurs, pas figé).
- Le texte est lu, par une voix d'homme ou par une voix de femme, selon le champ lexical de la phrase.
Loris
Laetitia
Youpiiiiie
Francois
programme (provisional)
Monday
Machine Learning & datasets
- 10:00-10:20: Introduction algolit http://www.algolit.net
- 10:20-10:30: Introduction Etherbox https://networksofonesown.constantvzw.org
- 10:30-11:00 Introduction AI / Machine learning
- 11:00-11:15 Break
- 11:15-11:45 Rulebased model: Markov Chain
- 11:45-12:15 Supervised machine learning & labeled datasets: Naive Bayes & sentiment analysis
- 12:15-13:00 Unsupervised machine learning & common crawl: word2vec
- 13-14u: Lunch
- 14-15u Guided tour Mundaneum in relation to dataset selection
- 15-17u
- For non-coders: Oulipo exercise on datasets
- For coders: Run the scripts per group, depending of level of programming
- Get the code running, play / variate on input and output (visualisations)
- Mundaneum dataset: what to do with it?
- Labeled - nltk corpora
- Unlabeled using ge
resources
For coders
With a proper python install a single line might / should work:
$ pip3 install nltk gensim scikit-learn matplotlib tensorflow pattern3 setuptools
in case pip3 does not work:
$ sudo apt-get install python3-pip
Requirements
- Python 3.x (comes with pip): https://www.python.org/downloads/release/python-370/
- Tensorflow: https://www.tensorflow.org/install/pip
- NLTK with all corpora
- Install NLTK
- instructions for Mac/Unix + Windows: https://www.nltk.org/install.html
- Mac / unix: should work with: (sudo ?) pip install nltk
- Windows: perhaps try with pip, otherwise https://pypi.org/project/nltk/ )
- Install NLTK data
- (through python shell): https://www.nltk.org/data.html
- Pattern for Python: https://pypi.org/project/pattern3/
- https://www.clips.uantwerpen.be/pattern
- Install NLTK
- Gensim
- https://radimrehurek.com/gensim/install.html
- (sudo ?) pip install --upgrade gensim
- Scipy: https://www.scipy.org/install.html
- Scikit Learn: http://scikit-learn.org/stable/install.html (install Scipy first!)
- matplotlib: https://matplotlib.org/users/installing.html
- virtual environment:
Git-repository: https://gitlab.constantvzw.org/algolit/mundaneum
links
online
visuels
See http://t2i.cvalenzuelab.com - article about the process: http://aiweirdness.com/post/177091486527/this-ai-is-bad-at-drawing-but-will-try-anyways
libraries
- Tensorflow: https://www.tensorflow.org
- GloVe: https://nlp.stanford.edu/projects/glove