Workshop:Algolit
Contents
projets
Florian
Le projet consiste en la création d'une installation interactive en rapport avec le travail d'Algolit sur le Machine Learning, l'utilisateur interagis avec le dispositif en temps réel et cette intervention va influé directement sur le résultat.
Première étape:
- Créer un fichier data.txt qui va contenir tout le texte générer par les différents intervenants.
[SCREEN A VENIR]
- Créer une interface graphique avec une boite de dialogue dans laquelle les intervenants vont écrire leur phrase à implémenter sur le fichier data.txt.
[SCREEN A VENIR]
Deuxième étape:
- Mettre en ligne le dispositif via un site web et le rendre actualisable en temps réel.
[SCREEN A VENIR]
Brandon
"Celui qui avale une noix de coco fait confiance en son anus"
Louise
Les textes de loi de prostitution
Travail en deux temps :
- Création d'une édition à partir du script (basé sur Markov Chain), enregistré en page html. --> Les phrases dans lesquelles reviennent le plus souvent le champ lexical de l'homme s'affichent en vert, celles dans lesquelles on retrouve le plus le champ lexical de la femme s'affichent en rouge. (ou autres couleurs, pas figé).
- Le texte est lu, par une voix d'homme ou par une voix de femme, selon le champ lexical de la phrase.
Loris
Laetitia
Youpiiiiie
Francois
programme (provisional)
Monday
Machine Learning & datasets
- 10:00-10:20: Introduction algolit http://www.algolit.net
- 10:20-10:30: Introduction Etherbox https://networksofonesown.constantvzw.org
- 10:30-11:00 Introduction AI / Machine learning
- 11:00-11:15 Break
- 11:15-11:45 Rulebased model: Markov Chain
- 11:45-12:15 Supervised machine learning & labeled datasets: Naive Bayes & sentiment analysis
- 12:15-13:00 Unsupervised machine learning & common crawl: word2vec
- 13-14u: Lunch
- 14-15u Guided tour Mundaneum in relation to dataset selection
- 15-17u
- For non-coders: Oulipo exercise on datasets
- For coders: Run the scripts per group, depending of level of programming
- Get the code running, play / variate on input and output (visualisations)
- Mundaneum dataset: what to do with it?
- Labeled - nltk corpora
- Unlabeled using ge
resources
For coders
With a proper python install a single line might / should work:
$ pip3 install nltk gensim scikit-learn matplotlib tensorflow pattern3 setuptools
in case pip3 does not work:
$ sudo apt-get install python3-pip
Requirements
- Python 3.x (comes with pip): https://www.python.org/downloads/release/python-370/
- Tensorflow: https://www.tensorflow.org/install/pip
- NLTK with all corpora
- Install NLTK
- instructions for Mac/Unix + Windows: https://www.nltk.org/install.html
- Mac / unix: should work with: (sudo ?) pip install nltk
- Windows: perhaps try with pip, otherwise https://pypi.org/project/nltk/ )
- Install NLTK data
- (through python shell): https://www.nltk.org/data.html
- Pattern for Python: https://pypi.org/project/pattern3/
- https://www.clips.uantwerpen.be/pattern
- Install NLTK
- Gensim
- https://radimrehurek.com/gensim/install.html
- (sudo ?) pip install --upgrade gensim
- Scipy: https://www.scipy.org/install.html
- Scikit Learn: http://scikit-learn.org/stable/install.html (install Scipy first!)
- matplotlib: https://matplotlib.org/users/installing.html
- virtual environment:
Git-repository: https://gitlab.constantvzw.org/algolit/mundaneum
links
online
visuels
See http://t2i.cvalenzuelab.com - article about the process: http://aiweirdness.com/post/177091486527/this-ai-is-bad-at-drawing-but-will-try-anyways
tools
- Les bases d' un service web avec python https://blog.miguelgrinberg.com/post/designing-a-restful-api-with-python-and-flask
libraries
- Tensorflow: https://www.tensorflow.org
- GloVe: https://nlp.stanford.edu/projects/glove