Per preservare lo stile in pixel art mentre si cambia la risoluzione, un filtro deve riuscire ad identificare e rispettare la trasparenza, la palette di colori, le linee diagonali, gli angoli acuti, i modelli di dither e le caratteristiche dei singoli pixel. Un'impresa davvero ardua.
Sebastien Benard (Deepnight Games) ha realizzato un tool per il level design che permette di creare le strutture dati essenziali per essere poi importate in qualsiasi framework: LDtk
Il PETSCII (PET Standard Code of Information Interchange) è l'ASCII delle macchine Commodore. Rispetto a quello che si può fare in pixel art, o con i caratteri ASCII tipici del PC, è ricco di spigoli acuti e linee curve, e questo lo caratterizza in modo particolare, rendendo immediatamente riconoscibili le immagini, che sembrano tutte realizzate con un vecchio "biscottone".
Ci sono tool di conversione che permettono perfino di realizzare video. Sotto possiamo ammirare come un Commodore 64 con Hard Disk molto più capienta sarebbe stato in grado di fare, in un ipotetico formato di distribuzione video.
Musenet permette molto semplicemente di caricare un file midi e trasformarlo nella sua versione acustica facendo uso di strumenti campionati con cura (soudfont). Il tutto compilando un semplice form.
Ma c'è molto di più: nella modalità semplice (mostrata di default), si possono ascoltare poche battute pre-generate. Si può scegliere un compositore o uno stile, un inizio opzionale di un pezzo famoso e iniziare a generare il resto del brano. Questo permette di esplorare la varietà di stili musicali che il modello può creare.
Nella modalità avanzata è possibile interagire direttamente con il modello. Le integrazioni richiederanno più tempo, ma si creerà un pezzo completamente nuovo.
Su edityouraudio.com il machine learning è in grado di separare la parte vocale da quella strumentale, partendo da un semplice link a youtube. Entrambi i file si possono scaricare.
Questo approccio è molto più efficace delle elaborazioni che si applicavano con goldwave o audacity sulle frequenze vocali per isolarle, e danno risultati di qualità superiore, che ad un primo ascolto rasentano la perfezione. Nella parte vocale vengono addirittura preservati i filtri, che sono riconoscibili nel brano solo dalle orecchie più allenate.
FastAPI è una delle tecnologie più immediate per creare delle API. Ecco alcune delle feature:
- Documentazione automatica tramite OpenAPI, che permette di fare cose come generare codice Python che sappia parlare con le API.
- Documentazione sull'interfaccia utente che permette di comprendere facilmente e interagire direttamente con l'API.
- Validazione degli input tramite Pydantic, lo stesso strumento usato per generare gli schemi nella documentazione. Fondamentalmente basta annotare il vostro endpoint con gli input/output e questi vengono documentati e validati.
- Facile da testare usando qualcosa come pytest grazie ad alcuni fantastici strumenti inclusi e alla flessibilità dell'iniezione di dipendenza.
- La fantastica documentazione di FastAPI, alcuni dei migliori in giro, dà accesso ad alcune delle feature migliori.
- Facile da ospitare su AWS Lambda usando Mangum.
Keijiro Takahashi (github, twitter), che lavora per Unity Technologies Japan, ha appena pubblicato un fantastico esempio di utilizzo di unity per fare upscaling di immagini con l'ausilio del machine learning. Si tratta di Waifu 2x, che era già disponibile online. Ma ora, grazie alla sua implementazione per unity, può essere eseguito in locale sul proprio computer. Basta un minimo di dimestichezza. Si inserisce una immagine intorno ai 300x300 pixel nella directory degli asset (/Assets/Test/), si modifica il riferimento "Source" del Tester in scena e si lancia unity. La CPU sale immediatamente di giri per eseguire il calcolo dell'upscaling e l'originale e la nuova immagine compaiono entro pochissimi secondi a video.
Viene usato Barracuda, la libreria di unity per il supporto di reti neurali. Ora grazie a questo esempio diventa molto più facile riuscire ad eseguire qualsiasi rete neurale sul proprio PC !
Si esporta la rete neurale originale dal suo framework Pytorch, TensorFlow o Keras nel formato standard ONNX.
Si aggiunge il file .onnx al progetto: questo si comporta come una normale risorsa.
Si carica il modello dall'asset.
Si crea il motore di inferenza (il worker).
Si esegue il modello e si recuperano i risultati.
The Tour Episode 7 | Unity Barracuda Tools | Unity Student Ambassador
Pyxel è un engine retro console 8-bit come Pico-8 per python. Solo 16 colori e 4 canali con 64 suoni definibili, per Win, Mac e Linux, il codice della cartuccia si scrive in python, legge come input keyboard, mouse e gamepad, editor di immagini e suoni integrato.