! pip install datasets


import datasets
from datasets import load_dataset


ds = load_dataset("osanseviero/twitter-airline-sentiment")


ds = ds['train']

ds

Dataset({
    features: ['tweet_id', 'airline_sentiment', 'airline_sentiment_confidence', 'negativereason', 'negativereason_confidence', 'airline', 'airline_sentiment_gold', 'name', 'negativereason_gold', 'retweet_count', 'text', 'tweet_coord', 'tweet_created', 'tweet_location', 'user_timezone'],
    num_rows: 14640
})


ds= ds.select_columns(['text', 'airline_sentiment'])


ds = ds.rename_column('airline_sentiment', 'label')

ds

Dataset({
    features: ['text', 'label'],
    num_rows: 14640
})


from transformers import pipeline

pipe = pipeline("sentiment-analysis", model="cardiffnlp/twitter-roberta-base-sentiment-latest")


outputs = pipe(ds['text'])


len(outputs), type(outputs)

(14640, list)


actual = ds['label']


len(actual), type(actual)

(14640, list)


actual[0]

'neutral'


outputs[0]['label']

'neutral'


correct = 0
total = 0
for i, label in enumerate(outputs):
    if label['label'] == actual[i]:
        correct += 1
    total += 1


print(f"Accuracy: {correct/total*100}")

Accuracy: 81.00409836065575