es-retention-graphs/main.py

#!/usr/bin/env python3
from optparse import OptionParser

from query import ESQueryPeers
from graph import PDGraphPeers

HELP_DESCRIPTION='This generates a CSV with buckets of peer_ids for every day.'
HELP_EXAMPLE='Example: ./unique_count.py -i "logstash-2019.11.*" -f peer_id'

def parse_opts():
    parser = OptionParser(description=HELP_DESCRIPTION, epilog=HELP_EXAMPLE)
    parser.add_option('-H', '--host', dest='es_host', default='localhost',
                      help='ElasticSearch host.')
    parser.add_option('-P', '--port', dest='es_port', default=9200,
                      help='ElasticSearch port.')
    parser.add_option('-i', '--index-pattern', default='logstash-*',
                      help='Patter for matching indices.')
    parser.add_option('-f', '--field', type='str', default='peer_id',
                      help='Name of the field to count.')
    parser.add_option('-m', '--max-size', default=10000,
                      help='Max number of counts to find.')
    (opts, args) = parser.parse_args()

    if not opts.field:
        parser.error('No field name specified!')

    return (opts, args)

def main():
    (opts, args) = parse_opts()

    esq = ESQueryPeers(opts.es_host, opts.es_port)

    data = []
    for index in esq.get_indices(opts.index_pattern):
        print('Index: {}'.format(index))
        data.extend(esq.get_peers(index, opts.field, opts.max_size))

    pdg = PDGraphPeers(data)

    plot = pdg.days_per_peers()
    plot.figure.savefig("days_per_peers.png")

    matrix = pdg.weekly_cohorts()
    matrix.figure.savefig("weekly_cohorts.png")

if __name__ == '__main__':
    main()