2021-STID2-MoviesAndTVshowsOnNetflix
Netflix est un service de streaming sur abonnement qui permet aux utilisateurs de regarder des séries et des films sans publicité sur n’importe quel appareil connecté à Internet.
Avec plus de 180 millions d'abonnés dans plus de 190 pays et plus de 125 millions d'heures de programmes visionnées par jour, Netflix est le leader mondial de la TV en streaming. En France, il y a 6,7 millions d’abonnés à Netflix, soit 1 français sur 10.
En 1997 Reed Hastings et Marc Randolph, les cofondateurs de Netflix décident de mélanger deux concepts : la location de films et la vente par correspondance. Ces deux concepts prennent forme grâce à un nouvel objet tout récent : le DVD.
La plate-forme de location met rapidement en place un système d’abonnement et des algorithmes qui lui permettent de proposer une offre personnalisée à ses clients. Et, c’est en 2007 que Netflix passe du DVD au streaming. Depuis, son succès est peu contesté.
Malgré ses réussites, la firme est accusée, par le milieu cinématographique, d’une concurrence déloyale.
Slides & Videos
Members
Name | Contribution |
---|---|
Natacha Batmini BATMANABANE | -Choix des données -Rédaction de l'état de l'art -Diaporama avec Prezi |
Ashwini SAMUEL | -Choix des données -Rédaction de l'état de l'art |
Ornella ANY | -Choix des données -Rédaction de l'état de l'art |
Natacha BATMANABANE Ashwini SAMUEL Ornella ANY | Le premier jeu de données est basé sur les films sur les différents platforms de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disney Nous avons choisi ces variables pour notre analyse: Nom du film va nous permettre de faire des analyses sur les films en trilogies par exemple Année de création du film va nous permettre de voir le succès des films par période Imdb sont des notes données au film sur le site IMDb Rotten Tomatoes est une note moyenne en pourcentage donné par l'utilisateur Netfilx (Analyse entre les 2 notes) Utiliser les films qui existent sur Netflix c'est-à dire où la colonne Netflix donne 1 Le second jeu de données est basé sur les émissions sur les différents platforms de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/tv-shows-on-netflix-prime-video-hulu-and-disney Nous avons choisi ces variables pour notre analyse: Nom des émissions va nous permettre de différencier Année de production du film va nous permettre de voir le succès des films par période Imdb sont des notes données aux émissions sur le site IMDb Rotten Tomatoes est une note moyenne en pourcentage donné par l'utilisateur Netfilx (Analyse entre les 2 notes) Utiliser les émissions qui existent sur Netflix c'est-à dire où la colonne Netflix donne 1 Le troisième jeu de données est sur Movies and TV Shows de Netflix de Shivam Bansal qui a été ajouté en février 2021, https://www.kaggle.com/shivamb/netflix-shows Nous avons choisi ces variables pour notre analyse: type pour distinguer les émissions et les films réalisateur va nous permettre l’influence des réalisateurs sur l’audience pays va nous permettre de faire des analyses sur la diversité que propose netflix Date à laquelle le film ou l’émission a été ajouté sur Netflix Année de réalisation va nous permettre de faire la différence avec la date à laquelle le film ou l’émission a été ajouté sur Netflix durée du film ou le nombre de saisons de l’émission va nous permettre de connaître l’implication de la durée Le quatrième jeu de données est Trending TV shows on Netflix de Rithesh Yadav en juillet 2020. Nous avons choisi ces variables pour notre analyse: https://www.kaggle.com/ritesh2000/trending-tv-shows-on-netflix Titre de la série pour distinguer Année de réalisation va nous permettre de voir l’audience imdb sont des notes qui va nous permettre de classer les émissions Netflix qui nous permettra de savoir si elle existe sur Netflix |
State of the Art
Business Aspect
Notre analyse sur les films et les émissions de Netflix intéressera les abonnés ou futurs abonnés de la plateforme. Cela permettra au public d’avoir plus de connaissances et un avis critique sur l’ensemble de Netflix.
Nous avons trouvé peu d’ études sur Netflix. Ainsi, nos analyses auront un impact global sur le marché du streaming. En effet, en ajoutant nos analyses les abonnés seront plus actifs sur Netflix.
L’article écrit par Nicolas en 2018
L’article écrit par Nicolas en 2018 cite que : “Pour faire simple, plus on utilise la plateforme, plus elle collecte des données sur nous, plus ses propositions seront qualitatives.”
« House of Cards » est la première série conçue à partir du BigData. Les algorithmes ont simplement indiqué qu’une série sur le monde politique avec l’acteur Kevin Spacey et réalisée par David Fincher serait un blockbuster. Comme prévu, la série a du succès.Désormais, les préférences des abonnés influencent toutes les décisions du streaming. Mais Netflix n’est pas un cas à part et l’ensemble des acteurs mondiaux du digital se servent plus que jamais du Big Data pour leurs activités.
IAS Insider a fait une étude le 12 mai 2020 sur la TV Connectée et Streaming Vidéo
Netflix domine le secteur des plateformes de SVOD, avec deux tiers des internautes abonnés soit 67%. Amazon Prime qui est 2ème avec 28%. À noter que l’étude a été réalisée en mars 2020, soit avant le lancement de Disney+.
Ils ont fait une analyse sur les abonnées, l’année d’ajout sur Netflix et les acteurs.
Leur but était de savoir ce qu’il y a sur Netflix et son impact dans le monde à travers ces abonnés. C’est une étude importante pour Netflix car elle met en avant les avantages et succès de la plateforme.
l’ensemble des données sont obtenues à partir de kaggle.com, qui sont à leur tour recueillies sur flixable.com qui permet aux utilisateurs de parcourir le contenu actuellement disponible sur Netflix États-Unis.
Technical Aspect
Elle a voulu mettre en avant le classement des notes IMDb (site de données sur les films et séries),moyennes des films produits dans un pays, la popularité d’un film par rapport aux réalisateurs et avertir sur les limites d’âges des films et séries de la plateforme.
Au niveau de la base de données, on note 69% de données manquantes pour la variable Rotten Tomatoes et 56% pour la variable limites d’âge. Ce qui biaise les résultats de son analyse.
liste complète des émissions de télévision disponibles sur les plateformes de streaming
Ce second jeu de données comprennent une liste complète des émissions de télévision disponibles sur : Netflix, Hulu, Prime Vidéo et Disney+. Il propose des comparaisons entre les différentes émissions et le classement des notes IMDb des émissions de télé que l’on trouve sur ces plateformes. Elle permet d’avertir sur les limites d’âges des films et séries et de connaître l’efficacité des différentes plateformes, c’est-à-dire, si l’année de production d’une émission de télévision est proche ou non de l’année de diffusion sur ces plateformes de streaming. L’échantillon de ce jeu de données n’est pas représentatif car, par exemple, dans la variable rotten tomatoes, la majorité des données sont des valeurs manquantes (82%). De plus,la majorité des émissions sélectionnées dans cet échantillon ne sont pas des émissions présentes sur ces plateformes de streaming.
TV Shows de Netflix de Shivam Bansal qui a été ajouté en janvier 2021.
Son but était de comprendre quel contenu est disponible dans différents pays,identifier le contenu similaire en faisant correspondre les fonctionnalités textuelles,trouver des liens entre les réseaux acteurs-réalisateurs et enfin savoir si Netflix se concentre plus sur les films ou les séries ces dernières années.
Cet échantillon de 50 Tv Shows ne contiennent que 19 de Netflix ce qui est précaire pour une étude sur Netflix.
top 50 des émissions de télévision tendance actuellement disponibles sur Netflix
Les données de ce 4ème jeu sont une collection de top 50 des émissions de télévision tendance actuellement disponibles sur Netflix. Il lui a permis de faire des études sur l’année de sortie et les notes IMDb de ces émissions.
L’échantillon de ce jeu de données n’est pas significatif car il s’agit d’une étude sur les émissions de télévision tendance sur Netflix or, on peut compter plus d’émissions non présentes sur Netflix que présentes.
Project Description
Problem Definition
Comment les films et les séries proposés par Netflix font le succès de la plateforme?
Quels sont les critères que les utilisateurs prennent en compte avant de regarder un film ou une série sur Netflix ?
Challenges & Motivation
Real and Complete Usecases
Notre proposition
Nous proposons une analyse sur les classements, l’audience et les caractéristiques des films et séries de Netflix.
Notre analyse sur les films et les émissions de Netflix intéressera les abonnés ou futurs abonnés de la plateforme. Cela permettra au public d’avoir plus de connaissances et un avis critique sur l’ensemble de Netflix.
Nous avons trouvé peu d’ études sur Netflix. Ainsi, nos analyses auront un impact global sur le marché du streaming. En effet, en ajoutant nos analyses les abonnés seront plus actifs sur Netflix.
Technical Description
CHOIX DES DONNEES
Le premier jeu de données est basé sur les films sur les différentes plateformes de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disney
Nous avons choisi ces variables pour notre analyse:
- Nom du film va nous permettre de faire des analyses sur les films en trilogies par exemple
- Année de création du film va nous permettre de voir le succès des films par période
- Imdb sont des notes données au film sur le site IMDb
- Rotten Tomatoes est une note moyenne en pourcentage donné par l’utilisateur Netfilx
(Analyse entre les 2 notes)
- Utiliser les films qui existent sur Netflix c’est-à dire où la colonne Netflix donne 1
Le second jeu de données est basé sur les émissions sur les différents platforms de streaming par Ruchi Bhatia qui a été ajouté en juin 2020 sur Kaggle. https://www.kaggle.com/ruchi798/tv-shows-on-netflix-prime-video-hulu-and-disney
Nous avons choisi ces variables pour notre analyse:
- Nom des émissions va nous permettre de différencier
- Année de production du film va nous permettre de voir le succès des films par période
- Imdb sont des notes données aux émissions sur le site IMDb
- Rotten Tomatoes est une note moyenne en pourcentage donné par l’utilisateur Netfilx
(Analyse entre les 2 notes)
- Utiliser les émissions qui existent sur Netflix c’est-à dire où la colonne Netflix donne 1
Le troisième jeu de données est sur Movies and TV Shows de Netflix de Shivam Bansal qui a été ajouté en février 2021, https://www.kaggle.com/shivamb/netflix-shows
Nous avons choisi ces variables pour notre analyse:
- type pour distinguer les émissions et les films
- réalisateur va nous permettre l’influence des réalisateurs sur l’audience
- pays va nous permettre de faire des analyses sur la diversité que propose netflix
- Date à laquelle le film ou l’émission a été ajouté sur Netflix
- Année de réalisation va nous permettre de faire la différence avec la date à laquelle le film ou l’émission a été ajouté sur Netflix
- durée du film ou le nombre de saisons de l’émission va nous permettre de connaître l’implication de la durée
Le quatrième jeu de données est Trending TV shows on Netflix de Rithesh Yadav en juillet 2020.
Nous avons choisi ces variables pour notre analyse:
https://www.kaggle.com/ritesh2000/trending-tv-shows-on-netflix
- Titre de la série pour distinguer
- Année de réalisation va nous permettre de voir l’audience
- imdb sont des notes qui va nous permettre de classer les émissions
- Netflix qui nous permettra de savoir si elle existe sur Netflix
Hardware
Materials
Image | Name | Part Number | Price | Count | Link |
---|---|---|---|---|---|
Power BI et R | Gratuit | 🛒 |