Aller au contenu


Photo

Analyse d'image côté serveur


  • Please log in to reply
43 réponses à ce sujet

#21 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 22 août 2013 - 12:25

T'as les étiquettes pour tes 300.000 vins ?

 

Pour réduire la puissance nécessaire il faut décomposer la comparaison et précalculer ce qui peut l'être pour les images de la base.

 

Sans décomposer, j'estime à 8 heures pour tester 300.000 étiquettes sur un macbook pro retina.

En calculant les keypoints à l'avance, on a que le temps de comparaison (18 ms), soit 1H30.

 

Donc il faut certainement faire un premier tri avec une autre méthode comme la comparaison d'histogramme qui est hyper rapide, si les histogrammes sont pré-calculés (0,01ms). Mais je ne sais pas combien d'étiquettes tu peux exclure avec cette méthode.

 

Donc, sur un seul Mac/PC ça parait difficilement envisageable de descendre en-dessous des 5/10 secondes pour une requête.

 

Après, il faudrait refaire les essais avec le prochain Mac Pro.

(Il y a un sample de SURF en openCL mais je n'ai pas réussi à le faire marcher).



#22 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 22 août 2013 - 13:39

T'as les étiquettes pour tes 300.000 vins ?

 

Je pense que 2/3 des vins ont  une étiquette mais la base grossit de 25.000 vins par mois environ...

 

 

 

Pour réduire la puissance nécessaire il faut décomposer la comparaison et précalculer ce qui peut l'être pour les images de la base.

 

Sans décomposer, j'estime à 8 heures pour tester 300.000 étiquettes sur un macbook pro retina.

En calculant les keypoints à l'avance, on a que le temps de comparaison (18 ms), soit 1H30.

 

Donc il faut certainement faire un premier tri avec une autre méthode comme la comparaison d'histogramme qui est hyper rapide, si les histogrammes sont pré-calculés (0,01ms). Mais je ne sais pas combien d'étiquettes tu peux exclure avec cette méthode.

 

OK, je comprends le principe.

 

 

 

Donc, sur un seul Mac/PC ça parait difficilement envisageable de descendre en-dessous des 5/10 secondes pour une requête.

 

J'imagine que Kooaba s'en sort en utilisant la puissance des serveurs amazon... et leur faible coût.

 

---

 

En tout cas, je te remercie de ton implication.

Je ne sais pas si je suis capable de mener à bien un tel projet.

Dans un premier temps, il faudrait que je trouve un moyen de purger la base de données (doublons, erreurs...). Bref, c'est un travail assez monstrueux. ;)

 

Il reste que je trouve le principe de scanner une étiquette et d'avoir les infos sur le vin super cool.

Dommage que l'OCR ne sache pas reconnaître les étiquettes de vins... il aurait suffit d'envoyer les chaînes au serveur.


Mes applications iOS: VinoCell

#23 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 22 août 2013 - 18:44

Je pense que 2/3 des vins ont  une étiquette mais la base grossit de 25.000 vins par mois environ...

 
c'est ta base perso issues des apps ?
 

En tout cas, je te remercie de ton implication.


C'est vrai que j'ai passé quelques heures, à qui j'envoie la facture ? ;)

Je suis dans une semaine veille techno, donc ça va, c'est toujours plus intéressant d'étudier un sujet avec un vrai enjeu.
 

Je ne sais pas si je suis capable de mener à bien un tel projet.
Dans un premier temps, il faudrait que je trouve un moyen de purger la base de données (doublons, erreurs...). Bref, c'est un travail assez monstrueux. ;)


Tu n'as pas le choix si tu veux rester compétitif. Après il faut trouver le bon moment pour le faire.
Avec OpenCV + amazon, c'est peut-etre le moment, je ne sais pas...

#24 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 22 août 2013 - 18:54

 
c'est ta base perso issues des apps ?
 

 

oui

 

 

Tu n'as pas le choix si tu veux rester compétitif. Après il faut trouver le bon moment pour le faire.
Avec OpenCV + amazon, c'est peut-etre le moment, je ne sais pas...

 

Oui, mais dans un premier temps, je dois me façonner la base de données (la purger comme je disais).

Bref, j'ai plein de projets... et d'idées.


Mes applications iOS: VinoCell

#25 chkdsks

chkdsks

    Cueilleur de cabosses

  • Membre
  • PipPipPip
  • 72 messages

Posté 30 août 2013 - 17:58

Je pense que cela ne s'appelerai pas un serveur dans ce cas. [je complète]

Je pense que les ingénieurs Apples doivent ajouter la méthode :

 

uploadFTPAvecRedirection:(id)sender;

vide à la classe NSIMage. (avec ce nouveau nom), je pense qu'il va y avoir une interconnexion avec le langage Ruby et Java ;-)


PowerBook G4 17" 1.5 GHz (10.5.8, Xcode 3.1.2) ; MacMini Core Duo 1.83 GHz (10.6.6, Xcode 3.2.5)
Donc vive les Universal Binaries ! :-)

#26 AliGator

AliGator

    Mouleur de chocolats

  • Contrôleur d'arômes
  • 13 621 messages
  • LocationRennes (France)

Posté 31 août 2013 - 08:08

Rien capté à ton message chkdsks
La Doc, c'est moi — Devise Shadok : S'il n'y a pas de solution, c'est qu'il n'y a pas de problème !
CocoaPods : Getting StartedLe Blog CocoaPodsCherchez des podsDocs de pods
Mon GitHub: OHHTTPStubs, SwiftGen…
Mon Blog: Crunchy Development

#27 yoann

yoann

    Brasseur de pâte à cacao

  • Membre
  • PipPipPipPipPipPipPip
  • 2 142 messages
  • LocationMarseille

Posté 31 août 2013 - 16:11

Je pense que cela ne s'appelerai pas un serveur dans ce cas. [je complète]

Je pense que les ingénieurs Apples doivent ajouter la méthode :

 

uploadFTPAvecRedirection:(id)sender;

vide à la classe NSIMage. (avec ce nouveau nom), je pense qu'il va y avoir une interconnexion avec le langage Ruby et Java ;-)

 

Kamoulox ?


  • AliGator aime ceci
Développeur & Consultant Mac
Apple Certified Trainer

#28 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 01 septembre 2013 - 19:15

Rien capté à ton message chkdsks

 

y'a clairement des secteurs défectueux.


  • AliGator aime ceci

#29 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 11 septembre 2013 - 13:55

Bon, je viens de me renseigner sur la licence SURF.

Accrochez-vos ceintures et dites un prix pour voir (prix par année) !


Mes applications iOS: VinoCell

#30 Alak

Alak

    Ecabosseur en fèves

  • Membre
  • PipPipPipPip
  • 329 messages
  • LocationParis

Posté 11 septembre 2013 - 14:04

1500e



#31 Draken

Draken

    Mouleur de chocolats

  • Artisan chocolatier
  • PipPipPipPipPipPipPipPip
  • 8 800 messages
  • LocationParis

Posté 11 septembre 2013 - 15:54

27.000 $ HT !

Garçon, servez-moi un Covfefe avec du lait de soja, sans OGM ..

Et faites régler la climatisation, il fait bien chaud, ici !

 

 

Éternel Novice !  :baby:

Tueur de poneys !  :(

 

Faire simple .. c'est compliqué !

Faire compliqué .. c'est simple !

 

Un MOOC (cours en ligne - dont je ne suis pas l'auteur) gratuit sur la programmation en Obj-C et en Swift 3, démarrant le 14 Mars 2017 :

https://www.edx.org/...onnex-progios1x

 

Des dizaines d'heures de tutoriels vidéo en français (je ne suis pas l'auteur) pour apprendre à développer en Obj-C et Swift : http://pagesperso-sy...don/5I452-2014/

 

 


#32 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 11 septembre 2013 - 17:15

6000€ / an



#33 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 11 septembre 2013 - 17:31

6000€ / an

 

Pas loin.

4000€/an + 4% des ventes


Mes applications iOS: VinoCell

#34 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 11 septembre 2013 - 17:33

T'as fait des essais avec leur système ? Combien de temps ça prend pour une étiquette de vin ?



#35 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 11 septembre 2013 - 19:57

Non, je n'ai pas fait d'essai de la techno elle-même.

J'ai juste fait des essais sur la base louée.


Mes applications iOS: VinoCell

#36 FKDEV

FKDEV

    Broyeur de fèves

  • Artisan chocolatier
  • PipPipPipPipPipPip
  • 1 660 messages

Posté 25 janvier 2014 - 12:54

Après, il faudrait refaire les essais avec le prochain Mac Pro.

(Il y a un sample de SURF en openCL mais je n'ai pas réussi à le faire marcher).

 

Qui a un Mac Pro sous la main ?



#37 Karoxys

Karoxys

    Cueilleur de cabosses

  • Membre
  • PipPipPip
  • 197 messages
  • LocationToulouse

Posté 15 juillet 2015 - 09:49

Bonjour,

 

Je reprends ce sujet intéressant pour les besoins de ma nouvelle application.

 

Je suis entrain de travailler sur un algo permettant de récupérer le montant d'un ticket de caisse.

L'idée: Photo du reçu et calcul du montant reçu.

 

Pour gérer la perspective de la photo j'ai a peu près le même résultat que Scannable (app evernote) travailler avec OpenCV.

 

Par contre pour récupérer le prix j'utilise tesseract. J'ai beau améliorer le contraste grâce à GPUImage mais le résultat n'est pas convenable. Mon algo marche super bien pour une plaque d'immatriculation mais pas pour mon petit ticket de caisse.

 

Et deuxième difficulté, il me faudrait savoir la taille de la font sur l'image pour en déduire (pour certain cas) plus facilement le prix.

 

 

Avez vous avancé sur cette problématique de votre côté ?

 

K.

 

 

PI: Je suis en mode MVP, du coup je ne peux pas me permettre de payer une librairie.

 

 

Merci pour vos retours.


iGoPlayer                   - http://www.smore.com/ze4s-igoplayer

Hollywood Challenge  - https://itunes.apple...?l=fr&ls=1&mt=8

Chekit [New)               - https://itunes.apple...d947849004?mt=8


#38 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 15 juillet 2015 - 17:07

Salut,

 

Pour mes besoins, j'ai trouvé 2 solutions clés en main, mais bonjour les prix:

Catchoom - Image Recognition and Augmented Reality

- Moodstocks - https://moodstocks.com

 

Attention les prix, vu ma base, ça pourrait être du 1000€ au mois...

 

Par contre, la reconnaissance est juste terrible !!! Je suis bleuffé.

 

---

 

Je teste parallèlement cette solution OpenSource qui s'appuie sur OpenCV: http://pastec.iosur Ubuntu.

Cela marche plutôt bien. J'en suis à 3 images reconnues sur 4, mais j'ai des problèmes quand il n'y a pas assez de détails. Je continue à tester ces jours-ci.

Le développeur est sympa (français).

 

---

 

Enfin, j'ai testé Tesseract pour les cas ou OpenCV ne convient pas.

Mes résultats sont horribles.

Les étiquettes de vins ont trop de problématiques (polices différentes, inclinaison...etc).

En plus, je trouve Tesseract pas si simple pour le training et donc pour lui apprendre à analyser.

 

Je crois qu'il y a 2 autres librairies concurrentes mais moins de doc sur le net. On en parle dans ce doc:

http://www.seas.upen...rt/Martinez.pdf


Mes applications iOS: VinoCell

#39 robertj

robertj

    Planteur de pousses

  • Membre
  • Pip
  • 3 messages

Posté 01 septembre 2015 - 11:51

Bonjour,
 
C'est assez drôle, et visiblement le monde est petit:) Je travaille dans le même domaine que vous (vin) et j'étudie la même problématique (OCR, Reconnaissance d'images, ...) depuis un bon moment.
Pour avoir étudier l'ensemble des technos que vous présentez (Catchoom, Moodstocks, Kooaba, Pastec, ...), celle qui m'a le plus impressionné, est celle de Catchoom. Ils ont à disposition un SDK que vous pouvez utilisez sur vos propres serveur (donc d'être indépendant de leur serveur). Evidemment, le prix n'est pas anodin, mais accessible (environ $15.000).
 
Quant à la techno Tesseract, j'ai fais développer des modules d'optimisation spécifique à la reconnaissance des étiquettes de bouteille de vins, le résultat sont déjà meilleurs mais pas assez satisfaisants.
 
Si cela vous intéresse, on peut en parler.


#40 muqaddar

muqaddar

    Mouleur de chocolats

  • Maître Chocolatier
  • 10 921 messages

Posté 01 septembre 2015 - 12:37

 

Bonjour,
 
C'est assez drôle, et visiblement le monde est petit:) Je travaille dans le même domaine que vous (vin) et j'étudie la même problématique (OCR, Reconnaissance d'images, ...) depuis un bon moment.

 

Sur quelle application ?

 

Pour avoir étudier l'ensemble des technos que vous présentez (Catchoom, Moodstocks, Kooaba, Pastec, ...), celle qui m'a le plus impressionné, est celle de Catchoom. 

 

 
 
Je confirme. Je n'ai eu que des résultats positifs.
J'ai aussi testé TinyEye (qui n'était pas dans la liste) utilisée par quelques concurrents.
 

Ils ont à disposition un SDK que vous pouvez utilisez sur vos propres serveur (donc d'être indépendant de leur serveur). Evidemment, le prix n'est pas anodin, mais accessible (environ $15.000).

 

ça peut-être intéressant en effet.

Je suis en contact avec un gars de Catchoom depuis deux mois qui a l'air "à l'écoute".

 

J'ai testé Pastec avec une autre branche, j'arrive à environ 70% de reconnaissance, ce qui n'est pas mal pour du gratuit, mais il faut soigner la taille de l'image, sa qualité, la prise de vue... et il est assez mauvais sur les étiquettes foncées (heureusement, 90% des étiquettes sont sur fond blanc). Je pensais partir avec ça "dans un premier temps".

 

Quant à la techno Tesseract, j'ai fais développer des modules d'optimisation spécifique à la reconnaissance des étiquettes de bouteille de vins, le résultat sont déjà meilleurs mais pas assez satisfaisants.

 

 

J'ai un peu laissé de côté cette techno.

 

Le problème pour nous, c'est la quantité d'images à avoir en base pour analyse: des centaines de milliers, et c'est ça qui coûte cher.

 

---

 

Sinon, j'ai pas trop avancé, dans le sens où ma base n'est pas encore structurée ni triée. C'est en cours. Et sans base propre, ça ne sert à rien d'investir dans la reco d'image, chaque chose en son temps. Il y aura évidemment une recherche textuelle en plus "intelligente".


Mes applications iOS: VinoCell




0 utilisateur(s) li(sen)t ce sujet

0 membre(s), 0 invité(s), 0 utilisateur(s) anonyme(s)