Πατέντες

Οι τεχνολογίες αιχμής που χρησιμοποιούμε στον web crawler και στην ανάλυση συναισθήματος έχουν πλέον κατοχυρωμένες πατέντες στις ΗΠΑ, την ΕΕ και την Ελλάδα. Από την έρευνα έως τις πατέντες, δεσμευόμαστε να παρέχουμε τις καλύτερες εξατομικευμένες υπηρεσίες ανάλυσης.

United States Patent and Trademark Office (USPTO)

Web Crawling and Content Summarization (Νο 12105761 B2)

Η παρούσα καινοτόμος λύση για τον web crawler αντιμετωπίζει την πρόκληση της αυτόματης κατάταξης του web crawler και της δημιουργίας μιας περίληψης ειδήσεων για θέματα ειδήσεων. Η λύση ανιχνεύει ειδησεογραφικά άρθρα από διάφορους ειδησεογραφικούς δικτυακούς τόπους με διαφορετικές δομές και τύπους περιεχομένου και περιλαμβάνει ειδήσεις, σχόλια κ.λπ. από μέσα κοινωνικής δικτύωσης, ιστολόγια και άλλες πηγές που δεν διαθέτουν συστήματα αυτόματης διανομής περιεχομένου.

Η τρέχουσα λύση χρησιμοποιεί αυτόματα δημιουργούμενα περιτυλίγματα ιστοσελίδων για την ανίχνευση, ανάλυση και εξαγωγή πληροφοριών από ιστοσελίδες με βάση τη δομή και το περιεχόμενό τους. Αυτό επιτυγχάνεται με τη χρήση εκφράσεων XPath και τεχνικών όπως τα νευρωνικά δίκτυα και η επεξεργασία φυσικής γλώσσας. Η αποτελεσματικότητα των περιτυλίξεων ιστοσελίδων αξιολογείται συνεχώς και ενημερώνονται αυτόματα κάθε φορά που αλλάζει η δομή των σχετικών ιστοσελίδων.

Οι πολιτικές ανίχνευσης ιστοσελίδων ενημερώνονται τακτικά ώστε να λαμβάνεται υπόψη η φήμη και η σημασία μιας ιστοσελίδας και να δίνεται προτεραιότητα στις πιο σημαντικές και ενημερωμένες ειδησεογραφικές ιστοσελίδες για ένα συγκεκριμένο θέμα. Η καινοτόμος προσέγγιση εξετάζει τον αριθμό των φορών που τα άρθρα μιας ιστοσελίδας αναφέρονται από άλλες πηγές, όπως ειδησεογραφικές ιστοσελίδες και μέσα κοινωνικής δικτύωσης, καθώς και τον αριθμό των άρθρων σε άλλες ιστοσελίδες που καλύπτουν το ίδιο γεγονός, θέμα ή οντότητα μετά την πρώτη συζήτησή του από την αρχική ιστοσελίδα.

Η διαδικασία ανίχνευσης ιστού πραγματοποιείται με τη χρήση πολλαπλών παράλληλων ουρών αναμονής για τη συλλογή ειδησεογραφικών στοιχείων και πολλαπλών νημάτων που ανακτούν τα στοιχεία από τις ουρές αναμονής. Αυτές οι παράλληλες ουρές συνδυάζονται τελικά σε μια ενιαία ουρά προτεραιότητας, η οποία χρησιμοποιείται για την ανίχνευση ιστοτόπων με βάση τις καθορισμένες πολιτικές.

Μόλις ληφθεί το περιεχόμενο, αναλύεται με διάφορες τεχνικές, όπως η κατανόηση φυσικής γλώσσας, και ομαδοποιείται ανάλογα με την ομοιότητα. Στη συνέχεια, δημιουργούνται περιλήψεις ειδησεογραφικών θεμάτων είτε επιλέγοντας σχετικές προτάσεις από τα ομαδοποιημένα άρθρα είτε χρησιμοποιώντας τεχνικές σύνθεσης φυσικής γλώσσας.

European Patent Office (EPO)

Web Content Sentiment Analysis (Pending)

Το τρέχον έργο ασχολείται με την εξαγωγή συναισθημάτων από διάφορες διαδικτυακές πηγές. Τα δεδομένα που συλλέγονται υποβάλλονται σε προεπεξεργασία για την εξαγωγή χρήσιμων χαρακτηριστικών που βοηθούν τους αλγορίθμους μηχανικής μάθησης στο έργο της ανάλυσης συναισθήματος. Συγκεκριμένα, οι λέξεις σε κάθε κείμενο μετατρέπονται σε ένα νευρωνικό χώρο ενσωμάτωσης και τροφοδοτούνται σε ένα υβριδικό, αμφίδρομο δίκτυο μακράς βραχυπρόθεσμης μνήμης, το οποίο περιλαμβάνει επίπεδα συνελικτικής μνήμης και έναν μηχανισμό προσοχής. Αυτά τα χαρακτηριστικά χρησιμοποιούνται στη συνέχεια για την παραγωγή των τελικών χαρακτηριστικών κειμένου.

Επιπλέον, το σύστημα αξιολογεί τη συχνότητα και τον τύπο των emoji, εάν εξάγονται αυτόματα ή αποδίδονται χειροκίνητα μέσω hashtags κ.λπ. Η προτεινόμενη προσέγγιση είναι καινοτόμος ως προς τον σημασιολογικό σχολιασμό των προεπεξεργασμένων στοιχείων δεδομένων, την ενίσχυση του σημασιολογικού τους πλαισίου με τον εντοπισμό μοτίβων και την απλούστευση του προβλήματος ανάλυσης με τη μείωση του μεγέθους των δεδομένων μέσω επιλεκτικής μείωσης της δειγματοληψίας και άλλων τεχνικών. Παρέχονται συγκεκριμένες λεπτομέρειες υλοποίησης που επιτυγχάνουν τις καλύτερες γνωστές επιδόσεις. Ωστόσο, εναλλακτικά παραδείγματα μπορούν να χρησιμοποιούν διαφορετικές διαμορφώσεις των επιπέδων στο νευρωνικό δίκτυο, διαφορετικά μεγέθη παραθύρων, κατώτατα όρια κ.λπ. Όλες αυτές οι παραλλαγές εμπίπτουν στο πεδίο εφαρμογής της καινοτόμου λύσης.

Αυτός ο ανιχνευτής ιστού δίνει προτεραιότητα στην ανίχνευση ιστοσελίδων και δημιουργεί περιλήψεις για ειδησεογραφικά θέματα διαφορετικών μορφών και τύπων περιεχομένου. Περιλαμβάνει επίσης σχόλια, αναρτήσεις και άλλους τύπους αλληλεπιδράσεων από τα μέσα κοινωνικής δικτύωσης και τα ιστολόγια. Χρησιμοποιεί αυτόματα παραγόμενες περιτυλίξεις ιστού για τον εντοπισμό, την ανάλυση και την εξαγωγή περιεχομένου ιστού με βάση τη δομή και το περιεχόμενό του, χρησιμοποιώντας μεθόδους όπως εκφράσεις XPath, νευρωνικά δίκτυα και επεξεργασία και κατανόηση φυσικής γλώσσας. Η αποτελεσματικότητα αυτών των περιτυλίξεων ιστοσελίδων αξιολογείται και ενημερώνονται αυτόματα όταν αλλάζει η δομή των αντίστοιχων ιστοσελίδων. Επιπλέον, οι πολιτικές περιτύλιξης ιστοσελίδων ενημερώνονται τακτικά ώστε να λαμβάνονται υπόψη παράγοντες όπως η φήμη, η επιρροή και ο αντίκτυπος μιας ιστοσελίδας.

Hellenic Industrial Property Organisation (OBI)

Web Crawling and Content Summarization (No 1010585)

Ο ανιχνευτής ιστού (web crawler) αναλύει, συγκεντρώνει και συνοψίζει το περιεχόμενο που εντοπίζεται. Δίνει προτεραιότητα στην ανίχνευση ιστού και δημιουργεί περιλήψεις ειδήσεων για θέματα με διάφορες δομές και τύπους περιεχομένου, συμπεριλαμβανομένων σχολίων, αναρτήσεων και άλλων αλληλεπιδράσεων από μέσα κοινωνικής δικτύωσης και ιστολόγια. Το πρόγραμμα ανίχνευσης χρησιμοποιεί αυτόματα παραγόμενες περιτυλίξεις ιστοσελίδων για την ανίχνευση, ανάλυση και εξαγωγή πληροφοριών από ιστοσελίδες με βάση τη δομή και το περιεχόμενό τους, χρησιμοποιώντας εκφράσεις XPath, νευρωνικά δίκτυα και επεξεργασία και κατανόηση φυσικής γλώσσας. Η αποτελεσματικότητα των περιτυλίξεων ιστοσελίδων αξιολογείται και ενημερώνονται αυτόματα όταν αλλάζει η δομή των σχετικών ιστοσελίδων. Οι πολιτικές περιτύλιξης ιστού ενημερώνονται επίσης συνεχώς ώστε να λαμβάνονται υπόψη παράγοντες όπως η φήμη, η επιρροή, ο αντίκτυπος και οι αναφορές σε έναν ιστότοπο ή μια τοποθεσία. Η διαδικασία ανίχνευσης χρησιμοποιεί πολλαπλές παράλληλες ουρές, καθεμία από τις οποίες υλοποιεί διαφορετικές μικροεπεξεργασίες, οι οποίες συγκλίνουν σε μια ενιαία ουρά προτεραιότητας που χρησιμοποιείται για την ανίχνευση με βάση τις πολιτικές ανίχνευσης.

Sentiment Analysis of Web Page Content

Sentiment Analysis of Web Page Content (Νο 1010537)

Παρέχεται ένα σύστημα και μια προσέγγιση για την εξαγωγή συναισθήματος σε στοιχεία δεδομένων ιστού από διάφορες πηγές ιστού. Τα δεδομένα ανίχνευσης υποβάλλονται σε προεπεξεργασία για την εξαγωγή χρήσιμων χαρακτηριστικών που βοηθούν τους αλγορίθμους μηχανικής μάθησης στην εργασία ανάλυσης συναισθήματος. Οι λέξεις σε κάθε κείμενο μετασχηματίζονται σε ένα νευρωνικό χώρο ενσωμάτωσης και τροφοδοτούνται σε ένα υβριδικό, αμφίδρομο δίκτυο βραχυπρόθεσμης μνήμης, μαζί με επίπεδα συνέλιξης και έναν μηχανισμό προσοχής, το οποίο εξάγει τα τελικά χαρακτηριστικά του κειμένου. Επιπλέον, εξάγονται διάφορα μεταδεδομένα εγγράφων, όπως τα σύμβολα emoji, τα οποία βοηθούν περαιτέρω στην ανίχνευση του συναισθήματος στα στοιχεία δεδομένων, στην αύξηση της αναγνώρισης προτύπων κ.λπ. Το πρόβλημα της ανάλυσης απλοποιείται επίσης με τη μείωση του μεγέθους των δεδομένων μέσω της επιλεκτικής μείωσης της δειγματοληψίας και άλλων μεθόδων.

Why Palowise?

#1:Use the industry's top artificial intelligence to handle the heavy work for you and gain insights in minutes.
#2:Receive an alert if something major occurs near your customer.
#3:Identify the influencers, material, and messaging required to generate success in real-time.
#4:Manage cross-channel campaigns with multidisciplinary groups and infinite channels.
#5:Monitor engagement and sentiment to get valuable insights.
#6:Monitor trending topics of discussion among users.